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3. This report contains indications relating to the following items: 
Basis of the report 
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Non-establishment of opinion with regard to novelty, inventive step and industrial applicability 
Lack of unity of invention 

Reasoned statement under Article 35(2) with regard to novelty, inventive step or industrial applicability; 
citations and explanations supporting such statement 

Certain documents cited 

Certain defects in the international application 

Certain observations on the international application 
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Iniemationai application No. 

PCT/FROO/01909 



I. Basis of the report 



I. With regard to the elements of the international application:* 
I I the international application as originally filed 
the description: 

pages 1>32 

pages 

pages 



. as orieinallv filed 



filed with the demand 



, filed with the letter of 



^ the claims: 

pages 

pages 

pages 

pages 



1-10, 11. IZ 18-24 



, as originally filed 

, as amended (together with any statement under Article 19 

, filed with the demand 



IK 12-16,17. 25-29 



filed with the letter of 



07 June 2001 (07.06.2001) 



^ the drawings: 

pages 

pages 

pages 



1/13-13/13 



as originally filed 



filed with the demand 



filed with the letter of 



I I the sequence listing part of the description: 

pages 

pages 

pages 



, as originally filed 



filed with the demand 



, filed with the letter of 



2. With regard to the language, all the elements marked above were available or furnished to this Authorit>' in the language in which 
the international application was filed, unless otherwise indicated under this item. 

These elements were available or furnished to this Authority in the following language which is 

□ 

the language of a translation furnished for the purposes of international search (under Rule 23.1(b)). 

n 

the language of publication of the international application (under Rule 48.3(b)). 

the language of the translation furnished for the purposes of international preliminary examination (under Rule 55.2 and/ 
or 55.3). 

3. With regard to any nucleotide and/or amino acid sequence disclosed in the international application, the international 
preliminary examination was carried out on the basis of the sequence listing: 

□ 

contained in the international application in wrinen form. 

□ 

filed together with the international application in computer readable form. 

□ 

furnished subsequently to this Authority in written form. 

□ furnished subsequently to this Authority in computer readable form. 

The statement that the subsequently furnished written sequence listing does not go beyond the disclosure in the 
international application as filed has been furnished. 

The statement that the information recorded in computer readable form is identical to the written sequence listing has 
been furnished. 



The amendments have resulted in the cancellation of: 

□ 

the description, pages 

the claims, Nos. 

I I the drawings, sheets/fig 



- I I This report has been established as if (some oO the amendments had not been made, since they have been considered to go 
— ' beyond the disclosure as filed, as indicated in the Supplemental Box (Rule 70.2(c)).** 

♦ • Replacement sheets which have been furnished to the receiving Office in response to an invitation under Article 14 are referred to 
in this report as "originally filed" and are not annexed to this report since they do not contain amendments (Rule 70.16 
and 70.17), 

^ Any replacement sheet containing such amendments must be referred to under item I and annexed to this report. 
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V. 


Reasoned statement under Article 35(2) with regard to novelty, inventive step or industrial applicability; 
citations and explanations supporting such statement 




1, 


Statement 














Novelty (N) 


Claims 




1 


.-29 VES 








Claims 






NO 






Inventive step (IS) 


Claims 




1 


-29 YES 








Claims 






NO 






Industrial applicability (lA) 


Claims 




1 


YES 








Claims 






NO 




2. 


Citations and explanations 














1 . The prior art 


most relevant 


for 


the application is 






considered to 


be Dl: AHMADI 


S ET 


AL: ^New techniques 





for sinusoidal coding of speech at 2400 bps' 
CONFERENCE RECORD OF THIRTIETH ASILOMAR CONFERENCE 
ON SIGNALS, SYSTEMS AND COMPUTERS (CAT. NO. 96 
CB36004), PACIFIC GROVE, CA, USA, 3-6 NOV. 1996, 
pages 770-774 vol. 1, XP002138769 1997, Los 
Alamitos, CA, USA, IEEE Comput . Soc. Press, USA 
ISBN: 0-8186-7646-9. 



2. Using the wording of Claim 1, Dl discloses a method 
for coding an audio signal (page 770, first 3 lines 
of the introduction) in which a fundamental 
frequency is estimated (page 770, left-hand column, 
last 2 lines) , a spectrum is determined by 
transformation in the frequency domain (LPC, page 
770, right-hand column, lines 16-25), and data 
representing spectral amplitude at multiples of the 
fundamental frequency are included in a digital data 
flow (A^™, Phi.^"*, page 770, right-hand column, lines 
20-23, see also Chapter 3, first paragraph, page 
771) . In Dl, the representative data are 
obtained by sampling the LPC envelope at multiples 
of the fundamental frequency, the value of which has 
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been determined by means of cepstral coefficients 
calculated by transforming, in the cepstral domain, 
the compressed spectrum (by applying a logarithm, as 
is common practice) of the audio signal. Moreover, 
the data contain a Phi\ phase information, which 
represents the phase of the spectrum at multiple 
frequencies of the fundamental frequency (see page 
770, right-hand column, lines 4-15, Phi'™* is 
associated with a\, which is the amplitude of the 
multiple line m of the segment k) . 

Consequently, only the feature according to which 
this is an upper envelope of the audio spectrum that 
is transformed to obtain the cepstral coefficients 
is novel over Dl . 

3. In Dl, the cepstrum is calculated in order to 

determine the fundamental frequency information, 
which can easily be read on said cepstrum, as is 
well known. It is therefore necessary to roughly 
calculate the inverse transformation of the spectrum 
module logarithm. If indeed only the spectrum 
envelope is considered, the spectral line 
information would disappear and the fundamental 
frequency calculation would no longer be possible on 
the resulting cepstrum. Therefore, there is no 
reason for a person skilled in the art to modify the 
teaching of Dl in order to add thereto the cepstral 
calculation from an upper envelope of the audio 
spectrum, as claimed. 

This novel feature, which in the application serves 
other purposes, must therefore be considered to be 
inventive . 
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4. Claims 2 to 15 are considered to be novel and 

inventive for the same reasons as Claim 1 on which 
they are dependent. 



The audio encoder of Claim 16, programmed to carry- 
out a method judged to be novel and inventive, is 
likewise considered to be novel and inventive. 

The features of determining phase as part of the 
decoding, as claimed in Claim 17 are neither known 
nor made obvious by Dl or by another document . Claim 
17 is therefore considered to be novel and 
inventive . 



7. Claims 18 to 25 are considered to be novel and 
inventive for the same reason as Claim 17 on which 
they are dependent . 

8. The features of determining phase variation as part 
of the decoding, as claimed in Claim 26, are neither 
known nor made obvious by Dl or by another document. 
Claim 26 is therefore considered to be novel and 
inventive . 



9. The audio decoder of Claim 29, which is programmed 
to carry out a method judged to be novel and 
inventive, is likewise considered to be novel and 
inventive . 



10. All of the claims are industrially applicable. 
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VII. Certain defects in the international application 



The following defects in the form or contents of the international application have been noted: 



Contrary to the requirement of PCT Rule 5.1(a) (ii) , the 

relevant prior art disclosed in document Dl has not been 

indicated in the description, nor has this document been 
cited. 
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10 



15 



20 




25 



yi and 



72 are coefficients lying between 0 and 1 and \x is 
a pre-emphasizing coefficient. 



30 



35 



12. The method as claimed in claim 11, in which |i = 
(72 " yi) .c(l) . 

13. The method as claimed in any one of claims 1 to 
12, in which a/ variation of the phase of the 
spectrum of the /audio signal is quantized over at 
least one interval of frequencies surrounding a 
frequency which/ is a multiple of the fundamental 
frequency (Fo), and quantization parameters (iAcp) 



AMENDED SHEET 



I 



07.06.2001 



- 46 - 



for said phase variation are include 
for coding the harmonic component. 



FR 0001909 

in the data 



14. The method as claimed in claim 13, in which the 
quantized phase variation is r/presented by the 
slope of the phase of the / spectrum at the 
frequency which is a multiple/of the fundamental 
frequency (Fo) . 



10 15. The method as claimed in clTaim 13, in which the 
quantized phase variation r/presents a phase model 
stored in a dictionary determined by learning. 

16. An audio coder, comprising programmed means for 
executing a method according to any one of 
claims 1 to 15. 



15 



17 



20 



25 



30 



35 



A method of decoding i digital input stream (O) 
representing a coded ^udio signal, iri which data 
for coding a fundamental frequency (Fo) of the 
audio signal and dita for coding a harmonic 
component comprisinig quantization data for 
cepstral coefficients - representing an upper 
spectral envelope (x(_sup) of the audio signal are 
received in the digital input stream, and a 
spectral estimate (Xv) of the harmonic component 
is generated, its irfodulus bising determined by said 
upper spectral en^4lope at the frequencies which 
are multiples of the fundamental frequency, 
characterized in tliat, to determine the phase (<pv) 
of the spectral estimate of the harmonic component 
(Xv) , the cepstrajJ. coefficients are transformed by 
liftering and sm< othing in the cepstral domain, 

3 ((p(lc)) of the audio signal at 
are multiples 



and minimum phase 
frequencies which 
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The method as claimed in claim 24,/ in which said 
threshold (dth) is adapted as a /cunction of the 
variations of the cepstral coefficients (cxp[n]). 



A method, of decoding a digital input stream {<t>) 
representing a coded audio signal, in which data 
for coding a fundamental frequency (Fq) of the 
audio signal and data for coding a harmonic 
component comprising quantization data for 
cepstral coefficients representing an upper 
spectral envelope (X_sup) /of the audio signal are 
received in the digital input stream, and a 
spectral estimate (Xv) OT the harmonic component 
is generated, its modulus being determined by said 
upper spectral envelope/ at the frequencies which 
are multiples of the fundamental frequency and a 
phase, characterized in that a phase variation 
(<Pv) of the spectral/ estimate of the harmonic 
component is determined over at least one interval 
of frequencies surrounding a frequency which is a 
multiple of the funda^nental frequency on the basis 
of quantization parameters (iAcp) included in the 
data for coding the harmonic component. 



/ 



The method as claimed in claim 26, in which the 
phase variation determined over an interval of 
frequencies is a linear variation represented by a 
slope quantization parameter. 



claimed 



The method as 
phase variation 
frequencies repres 
dictionary determi 



in claim 26; in which the 
(Jetermined over an interval of 
ents a phase model stored in a 
led by learning. 
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An audio decoder, comprisin'g programmed means for 
executing a method according to any one of claims 
17 to 28. 
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TRAITE DE COOPERATION EN MATIERE DE BREVETS 

PCT 

RAPPORT D'EXAMEN PRELIMINAIRE INTERNATIONAL 

(article 36 et regie 70 du PCT) 



R6f6rence du dossier du d^posant ou du 
mandataire 

BCT000055 BLO/EB/SDV 


voir la notification de transmission du rapport d'examen 
POUR SUITE A DONNER pr^limlnaire international (formulaire PCT/IPEA/416) 


Demande intemattonale n** 
PCT/FROO/01909 


Date du d6pot international (jour/mois/ann^e) 
04/07/2000 


Date de priority Oour/mois/ann4e) 
05/07/1999 


Classification intemationaie des brevets (CIB) ou ^ ia fols classification nationale et CIB 
G10L19/02 


D6posant 

MATRA NORTEL COMMUNICATIONS et al. 



1 . Le present rapport d'examen pr^limlnaire international, 4tabll par radministaratlon charg^e de rexamen pr^liminaire 
International, est transnnis au d^posant conform^ment k Tarticle 36. 

2. Ce RAPPORT comprend 6 feullles, y comprls la pr^sente feuille de couverture. 

S II est accompagn^ d'ANNEXES, c'est-^-dire de feullles de la description, des revendications ou des desslns qui ont 
^t^ modifi^es et qui servant de base au present rapport ou de feuilles contenant des rectifications faites aupr^s de 
Tadministration charg^e de Texamen pr^liminaire international (voir la rdgle 70.16 et I'instruction 607 des Instructions 
adnninistratlves du PCT). 

Ces annexes comprennent 2 feuilles. 



3. Le present rapport contient des indications relatives aux points suivants: 



1 




II 


□ 


III 


□ 


IV 


□ 


V 




VI 


□ 


VII 


lEI 


VIII 


□ 



d'application Industrielle 
Absence d'unlt6 de I'invention 

Declaration motivee selon i'article 35(2) quant k la nouveaute, I'activit^ inventiv 
d'application industrielle; citations et explications k I'appul de cette declaration 



Date de presentation de la demande d'examen preiiminaire 
intemationaie 

22/01/2001 



Date d'achevement du present rapport 
25.09.2001 



Nom et adresse postale de I'administration chargee de 
rexamen pr^liminaire international: 

^ Office europden des brevets 

D-80298 Munich 

T6I. +49 89 2399 - 0 Tx: 623656 epmu d 
Fax: +49 89 2399 - 4465 



Fonctionnaire autorise 

Bourdier, R 

de telephone +49 89 2399 2130 
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RAPPORT D'EXAMEN 
PRELIMINAIRE INTERNATIONAL 



Demande internationale n** PCT/FROO/01 909 



I. Base du rapport 

1. En ce qui concerne les elements de la demande internationale {les feuilles de remplacement qui ont 6t6 remises 
d i'office r^cepteur en reponse it une invitation faite conform^ment ^ i'article 14 sont consid4r6es dans le present 
rapport comme "initialement d4pos4es" et ne sont pas jointes en annexe au rapport puisqu'elles ne contiennent 
pas de modifications (regies 70. 16 et 70, 17)): 

Description, pages: 

1-32 version initiale 



Revendications, N"": 

1-10,11 (partie), version initiale 
17 (partie), 

18-24 

1 1 (partie),1 2-1 6. regue(s) le 07/06/2001 avec la letlre du 06/06/2001 

17 (partie), 

25-29 

Dessins, feuilles: 

1/1 3-1 3/1 3 version Initiale 



2. En ce qui concerne la langue, tous les Sl^ments indiquSs ci-dessus ^talent k la disposition de radministration ou 
lui ont 6\§ remis dans la langue dans laquelle la demande internationale a 6X6 d6pos6e, sauf indication contraire 
donn^e sous ce point. 

Ces 6l^ments §taient k la disposition de radministration ou lui ont 6X6 remis dans la langue suivante: , qui est : 

□ la langue d'une traduction remise aux fins de la recherche Internationale (selon la r^gle 23.1(b)). 

□ la langue de publication de la demande internationale (selon la r^gle 48.3(b)). 

□ la langue de la traduction remise aux fins de I'examen pr^liminaire internationale (selon la r^gle 55.2 ou 
55.3). 

3. En ce qui concerne les sequences de nucleotides ou d'acide amines divulgu^es dans la demande 
internationale (le cas ^ch^ant), I'examen pr^liminaire internationale a ^t^ affectum sur la base du listage des 
sequences : 

□ contenu dans la demande internationale, sous forme §crite. 

□ d^pos^ avec la demande internationale, sous forme d^chiffrable par ordinateur. 

□ remis ult6rieurement k radministration, sous forme 6crite. 

□ remis ult6rieurement h radministration, sous forme d6chiffrable par ordinateur. 
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□ La declaration, selon laquelle le listage des sequences par §crit et fourni ult6rieurement ne va pas au-del& 
de la divulgation faite dans la demande telle que d6posee, a 6t6 fournie. 

□ La declaration, selon laquelle les informations enregistrees sous d6chiffrable par ordinateur sont identiques 
celles du llstages des sequences Presents par 6cr\t, a 6X6 fournie. 

4. Les modifications ont enframe Tannulation : 

□ de la description, pages : 

□ des revendications, n~ : 

□ des dessins, feuilles : 

5. □ Le present rapport a 6te formuie abstraction faite (de certaines) des modifications, qui ont 6t6 consid6r6es 

comma allant au-del& de I'expose de invention tel quil a 6te depose, comme il est indique cl-apres (rfegle 
70.2(c)) : 

(Toute feuille de remplacement comportant des modifications de cette nature doit Stre indiqu6e au point 1 et 
annex4e au present rapport) 



6. Observations compl6mentaires, le cas ech6ant : 



V. Declaration motlvee selon Tarticfe 35(2) quant a la nouveaute, ractivlte inventive et la possibilite 
d'applicatlon industrielle; citations et explications a I'appui de cette declaration 

1. Declaration 

Nouveaute Oui : Revendications 1 -29 

Non : Revendications 

Activite inventive Oui: Revendications 1-29 

Non : Revendications 

Possibilite d'application industrielle Oui : Revendications 1 -29 

Non : Revendications 



2. Citations et explications 
voir feuille separee 



VII. Irregularites dans la dennande internationale 

Les Irregularites suivantes, concernant la forme ou le contenu de la demande internationale, ont ete constatees : 
voir feuille separee 
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CONCERNANT LA SECTION V 

1 . L'etat de la technique le plus pertinent pour la demande est considere comme 
etant D1 : AHMADI S ET AL: 'New techniques for sinusoidal coding of speech at 
2400 bps' CONFERENCE RECORD OF THIRTIETH ASILOMAR CONFERENCE 
ON SIGNALS, SYSTEMS AND COMPUTERS (CAT. NO.96CB36004), PACIFIC 
GROVE, CA, USA, 3-6 NOV. 1996, pages 770-774 vol.1 , XP0021 38769 1997, 
Los Alamitos. CA, USA, IEEE Comput. Soc. Press, USA ISBN: 0-8186-7646-9. 

2. En utilisant le libelle de la revendication 1, D1 divulgue un precede de codage 
d'un signal audio (page 770, 3 premieres lignes de I'lntroduction) dans lequel on 
estime une frequence fondamentale (page 770, colonne de gauche, 2 dernieres 
lignes), on determine un spectre par transformation dans le domaine frequentiel 
(LPC, page 770, colonne de droite, lignes 16-25), et on inclut dans un flot de 
donnees numeriques des donnees representatives d'amplitude spectrales aux 
multiples de la frequence fondamentale (A*"""' Phi''"' page 770, colonne de droite, 
lignes 20-23, voir aussi chapitre 3, premier paragraphe, page 771). Dans D1 , les 
donnees representatives A*""™ sent obtenues en echantillonnant I'enveloppe LPC 
aux multiples de la frequence fondamentale dont la valeur a ete determinee par le 
biais de coefficients cepstraux calcules en transformant dans le domaine cepstral 
le spectre comprime (par application d'un logarithme, comme il est usuel) du 
signal audio. D'autre part, les donnees contiennent une information de phase 
Phl^rn qui represente la phase du spectre aux frequences multiples de la 
frequence fondamentale (voir page 770, colonne de droite, lines 4-15, Phi*""™ est 
associe a A^^^* amplitude de la raie multiple m du segment k). 

Par consequent, seule la caracteristique selon lacuelle c'est une 
enveloppesuperieure du spectre audio qui est transformee pour obtenir les 
coefficientscepstraux, est nouvelle par rapport a D1 . 

3. Dans D1 , le cepstre est calcule afin de determiner Tinformation de 
frequencefondamentale, aisement lisible sur ledit cepstre, comme il est bien 
connu. II estnecessaire pour cela de calculer la transformation inverse du 
logarithme dumodule du spectre, brut. Si en effet, on ne considerait que 
Tenveloppe du spectre, information des raies spectrales disparattrait et le calcul 
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de frequence fondamentale ne serait plus possible sur le cepstre resultant. Par 
consequent, II n'y auralt aucune raison pour rhomme du metier de modifier 
Tenseignement de D1 pour y introduire le calcul cepstral a partir d'une envelopoe 
superieure du spectre audio, comme revendique, 

Cette caracteristique nouvelle, qui dans la demande sert a d'autres fins, doit done 
etre consideree comme inventive. 

4. Les revendications 2 a 15 sont considerees comma etant nouvelles et inventives 
pour les memes raisons que la revendication 1 dont elles dependent. 

5. Le codeur audio de la revendication 16, programme pour executer un precede 
juge nouveau et inventif, est egalement considere comme etant nouveau et 
inventif. 

6. Les caracteristiques de determination de la phase comme faisant partie du 
decodage, telles que revendiquees a la revendication 17, ne sont ni connues, ni 
rendues evidentes par D1 ou par un autre document. La revendication 17 est 
done consideree comme etant nouvelle et inventive. 

7. Les revendications 18 a 25 sont considerees comme etant nouvelles et inventives 
pour la meme raison que la revendication 17, dont elles dependent. 

8. Les caracteristiques de determination de variation de la phase comme faisant 
partie du decodage, telles que revendiquees a la revendication 26, ne sont ni 
connues, ni rendues evidentes par D1 ou par un autre document. La 
revendication 26 est done consideree comme etant nouvelle et inventive. 

9. Le decodeur audio de la revendication 29, programme pour executer un precede 
juge nouveau et inventif, est egalement considere comme etant nouveau et 
inventif. 

10. Toutes les revendications sont susceptibles d'application industrielle 
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CONCERNANT LA SECTION VII 

1. Contrairement a ce qu'exige la regie 5.1 a) ii) PCT, la description n'indique pas 
I'etat de la technique anterieure pertinent expose dans le document D1 et ne cite 
pas ce document. 
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Yi et 72 s^^nt c^^s coefficients compris entre 0 et 1 et ^ est un coefficient de 
preaccentuation. 

12. Proc6d6 selon la revendication 1 1 , dans lequel n = (y2 - y-j).c(1 ). 

13. Procedd selon I'une quelconque des revendications 1 a 12, dans 
5 lequel on quantifie une variation de la phase du spectre du signal audio sur au 

moins un intervalle de frequences entourant une frequence multiple de la 
frequence fondamentale (Fq), et on inclut des parametres (iAq>) de 

quantification de iadite variation de phase dans les donnees de codage de la 
composante hamnonique. 

10 14. Precede selon la revendication 13, dans lequel la variation de phase 
quantifies est representee par la pente de la phase du spectre a la frequence 
multiple de la frequence fondamentale (Fq). 

15. Precede selon la revendication 13, dans lequel la variation de phase 
quantifi§e reprdsente un module de phase m§morisd dans un dictlonnaire 

15 determine par apprentissage. 

16. Codeur audio, comprenant des moyens programmes pour exdcuter 
uii precede selon I'une quelconque des revendications 1 a 15. 

17. Precede de ddcodage d'un flux numdrique d'entr6e (a>} reprdsentant 
un signal audio code, dans lequel en revolt dans le flux numerique d'entrie des 

20 donnees de codage d'une frequence fondamentale (Fq) du signal audio et des 
donnees de codage d'une composante harmonique comprenant des donnees 
de quantification de coefficients cepstraux representant une enveloppe 
spectrale superieure ()L.sup) du signal audio, et on gen^re une estimation 
spectrale (X^) de la composante harmonique dent ie module est determine par 

25 Iadite enveloppe spectrale superieure aux frequences multiples de la frequence 
fondamentale, caracterise en ce que, pour determiner la phase ((p^) de 
Testimation spectrale de la composante harmonique (X^), on transforme les 
coefficients cepstraux par liftrage et lissage dans le domaine cepstral, et on 
calcule des phases minimales (q>(k)) du signal audio d des frequences multiples 
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25. Procddd selon la revendicatioh 24, dans lequel iedit seuii (d^,) est 
adapts en fonction des variations des coefficients cepstraux (o(p[n]). 

26. Procddd de dScodage d'un flux numerique d'entr^ (O) reprSsentant 
un signal audio code, dans lequel on re9olt dans le flux numdrique d'enb'Se des 

5 donndes de codage d'une frequence fondamentale (Fg) signal audio et des 
donnSes de codage d'une composante hamionique comprenant des donndes 
de quantification de coefTidents cepstraux representant une enveioppe 
spectraie sup6rieure (X_sup) du signal audio, et on g§n6re une estimation 
spectrale (Xy) de la composante hamnonique ayant un module dSterminS par 

10 ladite enveioppe spectrale supSrieure aux frequences multiples de la frequence 
' fondamentale et une phase, caracterisd en ce qu'on determine une variation de 
la phase (<py) de i'estimation spectrale de la composante harmonique sur au 
moins un intervene de frequences entourant une fr6quence multiple de la 
frequence fondamentale sur la base de param^tres de quantification (iA^) 

15 Indus dans ies donnees de codage de la composante harmonique. 

27. Proc6d§ selon la revendication 26, dans lequel la variation de phase 
ddtermin^e sur un intervene de frequences est une variation lineaire 
representee par un paramStre de quantification de pente. 

28. Proc6d6 selon la revendication 26, dans lequel la variation de phase 
20 dSterminSe sur un intervene de frequences represente un modele de phase 

memorisd dans un dictionnaire determine par appreritissage. 

29. Decodeur audio, comprenant des moyens programmes pour 
executer un precede selon I'une quelconque des revendicatlons 17 a 28. 
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(Date de priority (la plus ancienne) 
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Le present rapport de recherche Intemationale, dtabii par i'administration chargde de la recherche intemationale, est transmis au 
d^posant conform6ment k Particle 18. Une copie en est transmise au Bureau International. 



Ce rapport de recherche Intemationale comprend 3 feuilles. 

\T\ II est aussi acoompagnd d'une copie de cheque document retertif & I'dtat de la technique qui y est citd. 



1. Base du rapport 

a. En ce qui concerne la langue, la recherche Internationale a dtd effectude sur la base de la demande intemationale dans la 
langue dans laquelle elle a dtd d^posde, sauf indication contrarre donnde sous le mdme point 

I I la recherche intemationale a effectude sur la base d'une traduction de la demande intemationale remise k radministration. 

b. En ce qui concerne les sequences de nuclMldes ou d'acldes amines divulgudes dans la demande intemationale (le cas Mi6ant), 
la recherche intemationale a M affectum sur la base du llstage des s^uences : 
I I contenu dans la demande Intemationale, sous fonne dcrite. 
I I ddposde avec la demande Intemationale, sous forme d^chiffrable par ordinateur. 
I I remis ultdrieurement k radministration, sous fonne ^rite. 
I I remIs ultdrleurement k radministration, sous forme ddchtffrable par ordinateur. 

I I La declaration, selon laquelle le llstage des sequences prdsentd par dcrit et foumi utt^rieurement ne vas pas au-del& de la 
divulgation farte dans la demande telle que ddposde, a 6td foumle. 

I I La declaration, selon laquelle les informations enreglstr6es sous forme dechrfffrable par ordinateur sent identiques k oelles 
du llstage des sequences presents par dcrit, a dte foumie. 

2. II a ete estlmd que certalnes revendlcatlons ne pouvaient pas telre I'objet d'une recherche (voir le cadre 1). 

3. Q II y a absence d'unttd de I'lnvenUon (voir le cadre II). 



4. En ce qui concerne le titre, 

I I le texte est approuv6 tel qu'il a 6t6 remis par le ddposant. 
Pn Le texte a 6t4 etabli par radministration et a la teneur sulvante: 

CODAGE ET DECODAGE AUDIO AVEC COMPOSANTS HARMONIQUES ET PHASE MINIMALE 



En ce qui conceme rabr^ge, 

lY] '® ®^ approuvd tel qu'il a M remis par le d^posant 

□ le texte (reproduit dans le cadre III) a ^tabli par radministration conform^ment k la rdgle 38.2b). Le d^osant peut 
presenter des observations k radministration dans un ddlai d*un mois k compter de la date d'exp^itlon du present rapport 
de recherche intemationale. 
La figure des desslns k publier avec I'abr^gd est la Figure n*" 2Sl. 



Pn sugg6r6e par le ddposant. Q Aucune des figures 

I I paroe que le d6posant n*a pas sugg6r6 de figure. n est A publier. 

I I parce que cette figure caractdrise mieux rinvention. 
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(57) Abrege: Le codeur estime une fr^uence fondamentale (Fq) du signal audio, determine un spectre du signal audio par une 
transform^ dans le domaine frequentiel d*une trame du signal audio, et inclut dans le flux numerique transniis au decodeur des 
donnees de codage d^une composante harmonique du signal audio, comprenant des donnas representatives d' amplitudes spectrales 
associ^ a des frequences multiples de la frequence fondamentale estimee. Les donnees de codage de la composante harmonique 
comprennent en outre, pour au moins une des fr^uences multiples de la frequence fondamentale estimee, des donnees (iA<|>) relatives 
a la phase du spectre du signal audio au voisinage de cette frequence multiple. 
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CODAGE ET DECODAGE AUDIO AVEC COMPOSANTS HARMONIQUES ET 

PHASE MINIMALE 

La presente invention concerne le domaine du codage des signaux 
audio. Elle s' applique en particulier, mais non exclusivement, au codage de la 
parole, en bande etroite ou en bande elargie, dans diverses gammes de debit 
5 de codage. 

La conception tf un codec audio vise principalement a fournir un bon 
compromis entre le debit du flux transmis par le codeur et la qualite du signal 
audio que le decodeur est capable de reconstruire a partir de ce flux. 



10 codeurs reposant sur une analyse du signal audio dans le domaine spectral : le 
codeur estime une frequence fondamentale du signal, representant sa hauteur 
tonale (« pitch »), et {'analyse spectrale consiste a determiner des parametres 
representant la structure harmonique du signal aux frequences qui sont des 
multiples entiers de cette frequence fondamentale. Une modelisation de la 

15 composante non-harmonique, ou non-voisee. peut egalement etre effectuee 
dans le domaine spectral. Les parametres transmis au decodeur representent 
typiquement le module du spectre des composantes voisees et non-voisees. II 
s'y ajoute des informations representant soit des decisions voise/non-voise 
relatives a differentes portions de spectre, soit des informations sur la 

20 probabilite de voisement du signal, permettant au decodeur de determiner dans 
quelles portions du spectre il doit utiliser la composante voisee ou la 
composante non-voisee. 

Ces families de codeurs comprennent les codeurs du type MBE 
(« Multi-Band Excitation »), ou encore les codeurs de type STC (« Sinusoidal 

25 Transform Coder »). A titre de reference, on peut citer les brevets US 

4 856 068, 4 885 790, 4 937 873, 5 054 072, 5 081 681 , 5 195 166, 5 216 747. 

5 226 084, 5 226 1 08, 5 247 579, 5 473 727, 5 51 7 51 1 , 5 630 Oil , 5 630 01 2, 
5 649 050, 5 651 093, 5 664 051 , 5 664 052. 5 684 926. 5 701 390. 5 715 365, 
5 749 065, 5 752 222, 5 765 127, 5 774 837 et 5 890 108. 

30 Un but de la presente invention est de permettre, dans un schema de 

codage a analyse dans le domaine spectral, tf ameliorer la modelisation des 
phases du spectre du signal par le decodeur. 

U invention propose ainsi un precede de codage d'un signal audio, 
dans lequel on estime une frequence fondamentale du signal audio, on 

35 determine un spectre du signal audio par une transformee dans le domaine 



Dans cette optique, 11 a notamment ete developpe des families de 
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frequentiel d'une trame du signal audio, et on inclut dans un flux numerique de 
sortie des donnees de codage d'une composante hannonlque du signal audio, 
comprenant des donnees representatives d' amplitudes spectrales associees a 
des frequences multiples de la frequence fondamentale estim6e. Selon 
r invention, lesdites donnees representatives d'amplitudes spectrales associees 
a des frequences multiples de la frequence fondamentale sont obtenues au 
moyen de coefficients cepstraux calcules en transformant dans le domaine 
cepstral une enveloppe superieure comprimee du spectre du signal audio, et 
les donnees de codage de la composante harmonique comprennent en outre, 
pour au moins une des frequences multiples de la frequence fondamentale 
estimee, des donnees relatives a ia phase du spectre du signal audio au 
voisinage de ladite frequence multiple. 

Un autre aspect de la presente invention se rapporte a un precede de 
decodage d'un flux numerique d'entree representant un signal audio code, 
dans lequel on re?oit dans le flux numerique d'entree des donnees de codage 
d'une frequence fondamentale du signal audio et des donnees de codage 
d'une composante harmonique comprenant des donnees de quantification de 
coefficients cepstraux representant une enveloppe spectrale superieure du 
signal audio, et on genere une estimation spectrale de la composante 
harmonique dont le module est determine par ladite enveloppe spectrale 
superieure aux frequences multiples de la frequence fondamentale. Selon 
r invention, pour determiner la phase de I'estimation spectrale de la 
composante harmonique, on transforme les coefficients cepstraux par liftrage 
et lissage dans le domaine cepstral, et on calcule des phases minimales du 
signal audio a des frequences multiples de la frequence fondamentale sur la 
base des coefficients cepstraux transformes. Selon {'invention, on peut 
egalement determiner une variation de la phase de I'estimation spectrale de la 
composante harmonique sur au moins un intervalle de frequences entourant 
une frequence multiple de la frequence fondamentale sur la base de 
parametres de quantification inclus dans les donnees de codage de la 
composante harmonique. 

L' invention propose egalement un codeur et un decodeur audio 
comprenant des moyens pour la mise en oeuvre des precedes ci-dessus. 

D'autres particularites et avantages de la presente invention 
apparaitront dans la description ci-apres d'exemples de realisation non 
limitatifs, en reference aux dessins annexes, dans lesquels : 
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- la figure 1 est un schema synoptique d'un cx)deur audio salon I' invention ; 

- les figures 2 et 3 sent des diagrammes illustrant la formation des trames 
de signal audio dans le codeur de la figure 1 ; 

- les figures 4 et 5 sont des graphiques montrant un exemple de spectre 
5 du signal audio et illustrant I'extraction des enveloppes superieure et 

inferieure de ce spectre ; 

- la figure 6 est un schema synoptique tfun exemple de moyens de 
quantification utilisables dans le codeur de la figure 1 ; 

- la figure 7 est un schema synoptique de moyens utilisables pour extraire 
10 des parametres se rapportant a la phase de la composante non- 

harmonique dans une variante du codeur de la figure 1 ; 

- la figure 8 est un schema synoptique tf un decodeur audio correspondant 
au codeur de la figure 1 ; 

- la figure 9 est un organigramme d'un exemple de procedure de iissage 
15 de coefficients spectraux et d' extraction de phases minimales mise en 

oeuvre dans le decodeur de la figure 8 ; 

- la figure 10 est un schema synoptique de modules analyse et de 
mixage spectral de composantes harmonique et non-harmonique du 
signal audio ; 

20 - les figures 11 a 13 sont des graphiques montrant des exemples de 

fonctions non-lineaires utilisables dans le module d' analyse de la figure 
10; 

- les figures 14 et 15 sont des diagrammes illustrant une fagon de proceder 
a la synthese temporelle des trames de signal dans le decodeur de la 

25 figure 8 ; 

- les figures 16 et 17 sont des graphiques montrant des fonctions de 
fenetrage utilisables dans la synthese des trames suivant les figures 14 
et 15; 

- les figures 18 et 19 sont des schemas synoptiques de moyens 
30 d' interpolation utilisables dans une variante de realisation du codeur et du 

decodeur ; 

- la figure 20 est un schema synoptique de moyens d' interpolation 
utilisables dans une autre variante de realisation du codeur ; 

- les figures 21 et 22 sont des diagrammes illustrant une autre fa?on de 
35 proceder a la synthese temporelle des trames de signal dans le decodeur 

de la figure 8, a Taide d'une interpolation de parametres ; 
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- les figures 23 a 25 sont des schemas synoptiques de variantes de 
moyens de post-traitement des coefficients cepstraux representant 
renveloppe superieure du spectre du signal dans le codeur de la figure 
1 ;et 

- la figure 26 est un schema synoptique partiel d'un decodeur associe a un 
codeur selon la figure 25. 

Le codeur et le decodeur decrits ci-apres sont des circuits numerlques 
qui peuvent, comme il est usuel dans le domaine du traitement des slgnaux 
audio, etre realises par programmation d'un processeur de signal numerique 
(DSP) ou d'un circuit integre d' application specifique (ASIC). 

Le codeur audio represents sur la figure 1 traite un signal audio 
d'entree x qui, dans I'exemple non-limitatif considere ci-apres, est un signal de 
parole. Le signal x est disponible sous forme numerique. par exemple a une 
frequence d'echantillonnage de 8 kHz. II est par exemple delivre par un 
convertisseur analogique-num6rique traitant le signal de sortie amplifie d'un 
microphone. Le signal d'entree x peut egalement etre forme a partir d'une autre 
version, analogique ou numerique, codee ou non, du signal de parole. 

Le codeur comprend un module 1 qui forme des trames successives 
de signal audio pour les differents traitements effectues, et un multiplexeur de 
sortie 6 qui delivre un flux de sortie O contenant pour chaque trame des jeux 
de parametres de quantification a partir desquels un decodeur sera capable de 
synthetiser une version decodes du signal audio. 

La structure des trames est illustree par les figures 2 et 3. Chaque 
trame 2 est composes d'un nombre N d'echantillons consecutifs du signal 
audio X. Les trames successives prSsentent des decalages temporals mutuels 
correspondant a M echantillons. de sorte que leur recouvrement est de 
L = N-M echantillons du signal. Dans I'exemple considere. ou N = 256 
M = 160 et L = 96, la dur6e des trames 2 est de N/F^ = 32 ms. et une trame esl 
formee toutes les M/F^ = 20 ms. 

De fa?on classique. le module 1 multiplie les echantillons de chaque 
trame 2 par une fonction de fenetrage f^, de preference choisie pour ses 
bonnes proprietes spectrales. Les echantillons x(i) de la trame §tant numerotes 
de I = 0 a i - IM-1, la fenetre d'analyse f^(i) peut ainsi etre une fen§tre de 
Hamming, d' expression : 
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i-(N-1)/2 
N 



^a(')~ 0,54 + 0,46. cos 271 



(1) 



ou une fenetre de Manning d' expression : 




)) 



(2) 



ou encore une fenetre de Kaiser, d' expression : 




i~(N-1)/2 
N 




J 



(3) 



lo(cx) 



ou a est un coefficient par exemple egal a 6, et lo(.) designe la fonction de 
Bessel d'indice 0. 

Le codeur de la figure 1 procede a une analyse du signal audio dans le 
domaine spectral. II comporte un module 3 qui calcule la transformee de 
Fourier rapide (TFR) de cheque trame de signal. La trame de signal est mise 
en forme avant d'etre soumise au module de TFR 3 : le module 1 lui adjoint 
N = 256 echantillons a zero afin rfobtenir la resolution maximale de la 
transformee de Fourier, et il effectue d' autre part une permutation circulaire des 
2N = 512 echantillons afin de compenser les effets de phase resultant de la 
fenetre d'analyse. Cette modification de la trame est illustr§e par la figure 3. La 
trame dont on calcule la transformee de Fourier rapide sur 2N = 512 points 
commence par les N/2 = 128 derniers echantillons ponderes de la trame, suivis 
par les N = 256 echantillons a zero, et se termine par les N/2 = 128 premiers 
echantillons ponderes de la trame. 

Le module de TFR 3 obtient le spectre du signal pour cheque trame, 
dont le module et la phase sent respectivement notes |X| et (p^, ou |X(i)| et 

(Px(i) pour les index de frequence i = 0 a i = 2N-1 (grace a la symetrie de la 

transformee de Fourier et des trames, on peut se limiter aux valeurs pour 
0 < i < N). 

Un detecteur de frequence fondamentale 4 estime pour cheque trame 
de signal une valeur de la frequence fondamentale Fq. Le detecteur 4 peut 

appliquer toute methode connue d'analyse du signal de parole de la trame pour 
estimer la frequence fondamentale Fq, par exemple une methode basee sur la 

fonction tf autocorrelation ou la fonction AMDF, eventuellement precedee rfun 
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module de blanchiment par prediction lineaire. L'estimation peut egalement 
etre effectuee dans le domaine spectral ou dans le domaine cepstral. Une 
autre possibilite est d'evaluer les intervalles de temps entre les ruptures 
consecutives du signal de parole attribuables a des fermetures de la glotte du 
locuteur intervenant pendant la duree de la trame. Des methodes bien connues 
utilisables pour detecter de telles micro-ruptures sont decrites dans les articles 
suivants : M. Basseville et al., « Sequential detection of abrupt changes in 
spectral characteristics of digital signals » (IEEE Trans, on Information Theory, 
1983. Vol. IT-29, n» 5, pages 708-723) ; R. Andre-Obrecht. « A new statistical 
approach for the automatic segmentation of continuous speech signals » (IEEE 
Trans, on Acous., Speech and Sig. Proc. Vol.36, N°1, Janvier 1988); et 
C. MURGIA et al., « An algorithm for the estimation of glottal closure instants 
using the sequential detection of abrupt changes in speech signals » (Signal 
Processing VII, 1994, pages 1685-1688). 

La frequence fondamentale estimee Fg fait I'objet d'une quantification, 
par exemple scalaire, par un module 5, qui fournit au multiplexeur de sortie 6 
un index iF de quantification de la frequence fondamentale pour chaque trame 
du signal. 

Le codeur utilise des model isations parametriques cepstrales pour 
representer une enveloppe superieure et une enveloppe inferieure du spectre 
du signal audio. La premiere etape de la transformation cepstrale consiste a 
appliquer au module du spectre du signal une fonction de compression 
spectrale, qui peut etre une fonction logarithmique ou en racine. Le module 8 
du codeur op^re ainsi, pour chaque valeurX(i) du spectre du signal (0 ^ i < N), 
la transformation suivante : 

LX(i) = Log^X(i)|) (4) 
dans le cas d'une compression logarithmique ou 

LX(0 = |X(if (5) 

dans le cas d'une compression en racine, y etant un exposant compris entre 0 
eti. 

Le spectre comprime LX du signal audio est traite par un module 9 qui 
extrait des amplitudes spectrales associees aux harmoniques du signal 
correspondant aux multiples de la frequence fondamentale estimee FO. Ces 
amplitudes sont ensuite interpolees par un module 10 afin d'obtenir une 
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enveloppe superieure comprimee notee LX_sup. 

II est a noter que la compression spectrale pourrait de fafon 
equivalente etre effectuee apres la determination des amplitudes associees 
aux harmoniques. Elle pourrait egalement etre effectuee apres T interpolation, 
ce qui ne ferait que modifier la forme des fonctions d' interpolation, 

Le module 9 rfextraction des maxima tient compte de Teventuelle 
variation de la frequence fondamentale sur la frame d' analyse, des erreurs que 
peut commettre le detecteur 4, ainsi que des imprecisions liees au caractere 
discret de Techantillonnage en frequence. Pour cela, la recherche des 
amplitudes des pics spectraux ne consiste pas simplement a prendre les 
valeurs LX(i) correspondent aux index i tels que i.Fg/2N soit la frequence la 

plus proche d'une harmonique de frequence R.Fq (k > 1). Lamplitude spectrale 
retenue pour une harmonique ordre k est un maximum local du module du 
spectre au voisinage de la frequence k.pQ (cette amplitude est obtenue 

directement sous forme comprimee lorsque la compression spectrale 8 est 
effectuee avant F extraction des maxima 9). 

Les figures 4 at 5 montrent un exemple de forme du spectre comprime 
LX, ou on voit que les amplitudes maximales des pics harmoniques ne 
coincident pas necessairement avec les amplitudes correspondent aux 
multiples entiers de la frequence fondamentale estimee Fq. Les flancs des pics 

etant assez raides, une petite erreur de positionnement de la frequence 
fondamentale Fq. amplifiee par Tindice tfharmonique k, peut distordre 

fortement r enveloppe superieure estimee du spectre et provoquer une 
mauvaise modelisation de la structure formantique du signal. Par exemple. 
prendre directement I'amplitude spectrale pour la frequence 3.Fq dans le cas 
des figures 4 et 5 produirait une erreur importante dans Textraction de 
renveloppe superieure au voisinage de Tharmonique tf ordre k = 3, alors qu'il 
s'agit tfune zone energetiquement importante dans I'exemple dessine. En 
effectuant T interpolation a partir du veritable maximum, on evite ce genre 
d'erreur d'estimation de Tenveioppe superieure. 

Dans Texemple represente sur la figure 4, interpolation est effectuee 
entre des points dont Tabscisse est la frequence correspondent au maximum 
de ramplitude tf un pic spectrel, et dont I'ordonnee est ce maximum, avant ou 
apres compression. 
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L' interpolation effectuee pour calculer Tenveloppe superieure LX_sup 
est une simple interpolation lineaire. Bien entendu una autre forme 
d' interpolation pourrait etre utilisee (par exemple polynomiale ou spline). 

Dans la variante preferee representee sur la figure 5, I' interpolation est 
effectuee entre des points dont I'abscisse est une frequence R-Fq multiple de la 
frequence fondamentale (en fait la frequence la plus proche dans le spectre 
discret) et dont I'ordonnee est I'amplitude maximale. avant ou apres 
compression, du spectre au voisinage de cette frequence multiple. 

En comparant les figures 4 et 5, on peut voir que le mode d' extraction 
selon la figure 5. qui repositionne ies pics sur les frequences hannoniques, 
conduit a une mellleure precision sur I'amplitude des pics que le decodeur 
attribuera aux frequences multiples de la frequence fondamentale. II peut se 
produire un leger deplacement en frequence de la position de ces pics, ce qui 
n'est pas perceptuellement tres important et n'est d'ailleurs pas evit6 non plus 
dans le cas de la figure 4. Dans le cas de la figure 4, les points d'ancrage pour 
I'interpolation sent confondus avec les sommets des pics harmoniques. Dans le 
cas de la figure 5, on impose que ces points d'ancrage se trouvent precisement 
aux frequences multiples de la frequence fondamentale, leurs amplitudes 
correspondant a celles des pics. 

L'intervalie de recherche du maximum d'amplitude associe a une 
harnionique de rang k est centre sur I'index i de la frequence de la TFR la plus 

proche de R-Fq, c'est-di-dire i = ZNk^ + l 

L 2 

immediatement inferieur au nombre a. La largeur de cet intervalle de recherche 
depend de la frequence d'echantillonnage F^, de la taille 2N de la TFR et de la 
gamme de variation possible de la frequence fondamentale. Cette largeur est 
typlquement de I'ordre d'une dizaine de frequences avec les exemples de 
valeurs precedemment consideres. On peut la rendre reglable en fonction de la 
valeur Fq de la frequence fondamentale et du numero R de I'harmonique. 

Afin d'ameliorer la resolution dans les basses frequences et done de 
representer plus fidelement les amplitudes des harmoniques dans cette zone, 
une distorsion non-lineaire de I'echelle des frequences est op6ree sur 
I'enveloppe superieure comprimee par un module 12 avant que le module 13 
effectue la transformee de Fourier rapide Inverse (TFRI) fournissant les 
coefficients cepstraux cx_sup. 



, ou [a J designe rentier egal ou 
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La distorsion non-lineaire permet de minimiser plus efficacement 
Terreur de modeiisation. Elle est par exemple effectuee selon une echelle de 
frequences de type Mel ou Bark. Cette distorsion peut eventuellement 
dependre de la frequence fondamentale estimee Fq. La figure 1 illustre le cas 

5 de Techelle Mel. La relation entre les frequences F du spectre lineaire, 
exprimees en hertz, et les frequences F* de T echelle Mel est la suivante : 

c 1000 , f. F ^ 

Afin de limiter le debit de transmission, une troncature des coefficients 
cepstraux cx_sup est effectuee. Le module de TFRI 13 a besoin de calculer 

10 seulement un vecteur cepstral de NCS coefficients cepstraux d'ordres 0 a 
NCS-^1 . A titre rfexemple, NCS peut etre egal a 16. 

Un post'filtrage dans le domaine cepstral, appele post-liftrage, est 
applique par un module 15 a I'enveloppe superieure comprimee LX_sup. Ce 
post-liftrage correspond a une manipulation des coefficients cepstraux cx_sup 

15 delivres par le module de TRF1 13, qui correspond approximativement a un 
post-filtrage de la partie harmonique du signal par une fonction de transfert 
ayant la forme classique : 

ou A(2) est la fonction de transfert d'un filtre de prediction lineaire du signal 
20 audio, Y-j et 73 sont des coefficients compris entre 0 et 1, et |a est un coefficient 

de preaccentuation eventuellement nul. La relation entre le coefficient post-liftre 
d'ordre i, note Cp(i), et le coefficient cepstral correspondant c(l) = cx_sup(i) 

delivre par le module 13 est alors : 

Cp(0) = c(0) 

Cp (i) = (1 + Y2 - y!, )c(i) - ^ pour i > 0 

25 Le coefficient de preaccentuation optionnel \i peut etre controle en 

posant comme contrainte de preserver la valeur du coefficient cepstral 
cx_sup(1) relatif a la pente. En effet, la valeur c(1) = cx_sup(1) tfun bruit blanc 
filtre par le filtre de preaccentuation correspond au coefficient de 
preaccentuation. On peut ainsi choisir ce dernier de la fagon suivante : 

30 n = (y2-7^).c(1). 

Apres le post-liftre 15, un module de normalisation 16 modifie encore 
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les coefficients cepstraux en imposant la contrainte de modelisation exacte 
d'un point du spectre initial, qui est de preference le point le plus energetique 
pamni les maxima spectraux extraits par le module 9. En pratique, cette 
normalisation modifie seuiement la valeur du coefficient Cp(0). 

Le module de normalisation 16 fonctionne de la fapon suivante : il 
recalcule une valeur du spectre synthetise a la frequence du maximum indique 
par le module 9, par transformee de Fourier des coefficients cepstraux 
tronques et post-liftres, en tenant compte de la distorsion non-lineaire de I'axe 
des frequences ; il determine un gain de normalisation par la difference 
logarithmique entre la valeur du maximum foumie par ie module 9 et cette 
valeur recalculee ; et il ajoute le gain g,^ au coefficient cepstral post-liftre Cp(0). 

Cette normalisation peut etre vue comme faisant partie du post-liftrage. 

Les coefficients cepstraux post-liftres et normalises font I'objet dune 
quantification par un module 18 qui transmet des index de quantification 
correspondents icxs au multiplexeur de sortie 6 du codeur. 

Le module 18 peut fonctionner par quantification vectorielle a partir de 
vecteurs cepstraux formes de coefficients post-liftres et normalises, notes ici 
cx[n] pour la trame de signal de rang n. A titre d'exemple, le vecteur cepstral 

cx[n] de NCS = 16 coefficients cepstraux cx[n,0], cx[n,1] cx[n,NCS-1] est 

distribue en quatre sous-vecteurs cepstraux contenant chacun quatre 
coefficients d'ordres consecutifs. Le vecteur cepstral cx[n] peut etre traite par 
les moyens representes sur la figure 6. faisant partie du module de 
quantification 18. Ces moyens mettent en oeuvre, pour chaque composante 
cx[n,i], un predicteur de la forme : 

cxpin, i] = (1 - a(i)). rcx{n, i] + a(i).ra([n-1. 0 (9) 
ou rcxin] deslgne un vecteur residue! de prediction pour la trame de rang n 
dont les composantes sont respectivement notees rcx[n,0], rcx[n,1], 
rcx[n,NCS-1], et a(i) designe un coefficient de prediction choisi pour etre 
representatif d'une correlation inter-trame supposee. Apres quantification des 
residus, ce vecteur residuel est defini par : 

rcx[n.il=^^tn,i]-a(i).rcx^q[n-1,i] 
2-a(i) 

ou rcx_q[n-1] designe le vecteur residuel quantifie pour la trame de rang n-1, 
dont les composantes sont respectivement notees rcx_q[n,0], rcx_q[n,1], .... 
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rcx_q[n,NCS-1]. 

Le numerateur de la relation (10) est obtenu par un soustracteur 20, 
dont les composantes du vecteur de sortie sont divisees par les quantites 
2-a(i) en 21. Aux fins de ia quantification, le vecteur residuel rcx[n] est 
5 subdivise en quatre sous-vecteurs, correspondant a la subdivision en quatre 
sous-vecteurs cepstraux. Sur la base rfun dictionnaire obtenu par 
apprentissage prealable, T unite 22 procede a la quantification vectorielle de 
chaque sous-vecteur du vecteur residuel rcx[n]. Cette quantification peut 
consister, pour chaque sous-vecteur srcx[n], a selectionner dans le dictionnaire 
10 le sous-vecteur quantifie srcx_q[n] qui minimise Terreur quadratique 

||srcx[n} - srcx_q[n]|| . L' ensemble icxs des index de quantification lex. 

correspondant aux adresses dans le ou les dictionnaires des sous-vecteurs 
residuels quantifies srcx_q[n], est fourni au multiplexeur de sortie 6. 



15 quantifies, qui forment le vecteur rcx_q[n]. Ceiui-ci est retarde rfune trame en 
23, et ses composantes sont multipliees par les coefficients a(i) en 24 pour 
fournir le vecteur a T entree negative du soustracteur 20. Ce dernier vecteur est 
tf autre part fourni a un additionneur 25, dont I'autre entree regolt un vecteur 
forme par les composantes du residu quantifie rcx_q[n] respectivement 

20 multipliees par les quantites 1-a(i) en 26. Uadditionneur 25 delivre ainsi le 
vecteur cepstral quantifie cx_q[n] que recuperera le decodeur. 

Le coefficient de prediction a(i) peut etre optimise separement pour 
chacun des coefficients cepstraux. Les dictionnaires de quantification peuvent 
aussi etre optimises separement pour chacun quatre sous-vecteurs cepstraux. 

25 D'autre part, il est possible, de fagon connue en soi, de normaliser les vecteurs 
cepstraux avant tf appliquer le schema de prediction/quantification, a partir de 
la variance des cepstres. 

II est a noter que le schema ci-dessus de quantification des coefficients 
cepstraux peut rfetre applique que pour certaines seulement des trames. Par 

30 exemple, on peut prevoir un second mode de quantification ainsi qu'un 
processus de selection de celui des deux modes qui minimise un critere de 
moindres carres avec les coefficients cepstraux a quantifier, et transmettre 
avec les index de quantification de la trame un bit indiquant lequel des deux 
modes a ete selectionne. 

35 Les coefficients cepstraux quantifies cx_sup_q = cx_q[n] fournis par 



Uunite 22 delivre egalement les valeurs des sous-vecteurs residuels 
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I'additionneur 25 sont adresses a un module 28 qui recalcule les amplitudes 
spectrales associees a une ou plusieurs des harmoniques de la frequence 
fondamentale Fq (figure 1). Ces amplitudes spectrales sont par exemple 
calculees sous forme comprimee, en appliquant la transformee de Fourier aux 
coefficients cepstraux quantifies en tenant compte de la distorsion non-lineaire 
de I'echelle des frequences utilisee dans la transfonmatlon cepstrale. Les 
amplitudes ainsi recalculees sont foumies a un module d'adaptation 29 qui les 
compare a des amplitudes de maxima determinees par le module d'extraction 
9. 

Le module d'adaptation 29 controle le post-liftre 15 de fafon a 
minimiser un ecart de module entre le spectre du signal audio et les valeurs de 
module con-espondantes calculees en 28. Cet ecart de module peut etre 
exprime par une somme de valeurs absolues de differences d'amplitudes, 
comprimees ou non, correspondant a une ou plusieurs des frequences 
harmoniques. Cette somme peut etre ponderee en fonction des amplitudes 
spectrales associees a ces frequences. 

De fagon optimale, I'ecart de module pris en compte dans I'adaptation 
du post-liftrage tiendrait compte de toutes les harmoniques du spectre. 
Cependant, afin de reduire la complexite de I' optimisation, le module 28 peut 
ne resynthetiser les amplitudes spectrales que pour une ou plusieurs 
frequences multiples de la frequence fondamentale Fq. selectionnees sur la 
base de I'importance du module du spectre en valeur absolue. Le module 
d'adaptation 29 peut par exemple considerer les trois pics spectraux les plus 
intenses dans le calcul de I'ecart de module S minimiser. 

Dans une autre realisation, le module d'adaptation 29 estime une 
courbe de masquage spectral du signal audio au moyen d'un modele 
psychoacoustique. et les frequences prises en compte dans le calcul de I'ecart 
de module d minimiser sont selectionnees sur la base de I'importance du 
module du spectre relativement a la courbe de masquage (on peut par 
exemple prendre les trois frequences pour lesquelles le module du spectre 
depasse le plus de la courbe de masquage). Differentes methodes classiques 
sont utilisables pour calculer la courbe de masquage a partir du signal audio. 
On peut par exemple utiliser celle developpee par J.D. Johnston (« Transform 
Coding of Audio Signals Using Perceptual Noise Criteria », IEEE Journal on 
Selected Area in Communications. Vol. 6, No. 2, fevrier 1988). 
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Pour realiser 1' adaptation du post-liftrage, le module 29 peut utiliser un 
modele d' identification de filtre. Une methode plus simple consiste a predefinir 
un ensemble de jeux de parametres de post-liftrage, c'est-a-dire un ensemble 
de couples y^. 72 dans le cas d'un post-liftrage selon les relations (8), a 

5 effectuer les operations incombant aux modules 15, 16, 18 at 28 pour chacun 
de ces jeux de parametres, et a retenir celui des jeux de parametres qui 
conduit a Tecart de module minimal entre le spectre du signal et les valeurs 
recalculees. Les index de quantification foumis par le module 18 sont alors 
ceux qui se rapportent au meilleur jeu de parametres. 

10 Par un processus analogue a celui de I'extraction des coefficients 

cx_sup representant I'enveloppe superieure comprimee LX_sup du spectre du 
signal, le codeur determine des coefficients cx_inf representant une enveloppe 
inferieure comprimee LXJnl Un module 30 extrait du spectre comprime LX 
des amplitudes spectrales associees a des frequences situees dans des zones 

15 du spectre intermediaires par rapport aux frequences multiples de la frequence 
fondamentale estimee Fq. 

Dans Texemple illustre par les figures 4 et 5, cheque amplitude 
associee a une frequence situee dans une zone intermediaire entre deux 
harmoniques successives k.Fo et (k+1).FQ correspond simplement au module 
20 du spectre pour la frequence (k+1/2).FQ situee au milieu de r intervene separant 

les deux harmoniques. Dans une autre realisation, cette amplitude pounrait etre 
une moyenne du module du spectre sur une petite plage entourant cette 
frequence (k+1/2).Fo. 

Un module 31 precede a une interpolation, par exemple lineaire, des 
25 amplitudes spectrales associees aux frequences situees dans les zones 
intermediaires pour obtenir I'enveloppe inferieure comprimee LXJnf 

La transformation cepstrale appliquee a cette enveloppe inferieure 
comprimee LXJnf est effectuee suivant une echelle de frequences resultant 
d'une distorsion non-lineaire appliquee par un module 32. Le module de TFRI 
30 33 calcule un vecteur cepstral de NCI coefficients cepstraux cxjnf d'ordres 0 a 
NCM representant Tenveioppe inferieure. NCI est un nombre qui peut etre 
sensiblement plus petit que NCS, par exemple NCI = 4. 

La transformation non-lineaire de 1' echelle des frequences pour la 
transformation cepstrale de Tenveloppe inferieure peut etre realisee vers une 
35 echelle plus fine aux hautes frequences qu'aux basses frequences, ce qui 
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permet avantageusement de bien modeliser les composantes non-voisees du 
signal aux hautes frequences. Toutefois, pour assurer une homogeneite de 
representation entre i'enveloppe superleure et I'enveloppe inferieure, on pourra 
preferer adopter dans le module 32 la meme echelle que dans le module 12 
(Mel dans I'exemple considere). 

Les coefficients cepstraux cx_inf representant I'enveloppe inferieure 
comprimee sont quantifies par un module 34, qui peut fonctionner de la meme 
maniere que le module 18 de quantification des coefficients cepstraux 
representant I'enveloppe superieure comprimee. Dans le cas considere, ou on 
se limite a NCI = 4 coefficients cepstraux pour I'enveloppe inferieure, le vecteur 
ainsi forme est soumis a une quantification vectorielle de residu de prediction, 
effectuee par des moyens identiques a ceux representes sur la figure 6 mais 
sans subdivision en sous-vecteurs. L'index de quantification icx = icxi 
determine par le quantificateur vectoriel 22 pour chaque trame relativement aux 
coefficients cx_jnf est fourni au multiplexeur de sortie 6 du codeur. 

Le codeur repr§sente sur la figure 1 ne comporte aucun disposltif 
particulier pour coder les phases du spectre aux harmoniques du signal audio. 

En revanche, 11 comporte des moyens 36-40 pour coder une 
information temporelle liee a la phase de la composante non-harmonique 
representee par I'enveloppe Inferieure. 

Un module 36 de decompression spectrale et un module 37 de TFRI 
forment une estimation temporelle de la trame de la composante non- 
harmonique. Le module 36 applique une fonction de decompression reciproque 
de la fonction de compression appllquee par le module 8 (c'est-a-dire une 
exponentielle ou une fonction puissance 1/y) a I'enveloppe inferieure 
comprimee LXJnf produite par le module d' interpolation 31 . Ceci fournit le 
module de la trame estim^e de la composante non-hamnonique, dont la phase 
est prise egale a celle <px du spectre du signal X sur la trame. La transfomiee 
de Fourier inverse effectuee par le module 37 fournit la trame estimee de la 
composante non-harmonique. 

Le module 38 subdivise cette trame estimee de la composante non- 
harmonique en plusieurs segments temporels. La trame delivree par le module 
37 se composant de 2N = 512 echantillons ponder6s comme illustre par la 
figure 3, le module 38 considere seulement les N/2 = 128 premiers echantillons 
et les N/2 = 128 demiers echantillons, et les subdivise par exemple en 



wo 01/03121 PCT/FROO/01909 

- 15- 

huit segments de 32 echantillons consecutifs representant chacun 4 ms de 
signal. 

Pour chaque segment, le module 38 calcule Tenergie egale a la 
somme des carres des echantillons, et forme un vecteur E1 forme de 
5 huit composantes reelles positives egales aux huit energies calculees. La plus 
grande de ces huit energies, notee EM, est egalement determinee pour etre 
fournie, avec le vecteur E1, a un module de normalisation 39. Celui-ci divise 
chaque composante du vecteur E1 par EM, de sorte que le vecteur normalise 
Emix est forme de huit composantes comprises entre 0 et 1 . C'est ce vecteur 
10 normalise Emix, ou vecteur de ponderation, qui est soumis a la quantification 
par le module 40. Celui-ci peut operer une quantification vectorielle avec un 
dictionnaire determine lors d'un apprentissage prealable. L index de 
quantification iEm est fourni par le module 40 au multiplexeur de sortie 6 du 
codeur. 

15 La figure 7 montre une variante de realisation des moyens employes 

par le codeur de la figure 1 pour determiner le vecteur Emix de ponderation 
energetique de la frame de la composante non-harmonique. Les modules 36, 
37 de decompression spectrale et de TFRI fonctionnent comme ceux qui 
portent les memes references sur la figure 1. Un module de selection 42 est 

20 ajoute pour determiner la valeur du module du spectre soumis a la transformee 
de Fourier inverse 37. Sur la base de la frequence fondamentale estimee Fq, le 

module 42 identifie des regions harmoniques et des regions non-harmoniques 
du spectre du signal audio. Par exemple, une frequence sera consideree 
comme appartenant a une region harmonique si elle se trouve dans un 
25 intervalie de frequences centre sur une harmonique k.pQ et de largeur 

correspondant a une largeur de raie spectrale synthetisee, et a une region non- 
harmonique sinon. Dans les regions non-harmoniques, le signal complexe 
soumis a la TFRI 37 est egal a la valeur du spectre, c'est-a-dire que son 
module et sa phase correspondent aux valeurs |X| et <px foumies par le module 

30 de TFR 3, Dans les regions harmoniques, ce signal complexe a la meme 
phase (py^ que le spectre et un module donne par Tenveloppe inferieure apres 

decompression spectrale 36. Cette fagon de proceder selon la figure 7 procure 
une modelisation plus precise des regions non-harmoniques. 

Le decodeur represents sur la figure 8 comprend un demultiplexeur 
35 d' entree 45 qui extrait du flux binaire O, issu d'un codeur selon la figure 1, les 
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index iF, icxs, icxi, iEm de quantification de la frequence fondamentale Fq, des 
coefficients cepstraux representant Tenveloppe supeheure comprimee, des 
coefficients representants I'enveloppe inferieure comprimee, et du vecteur de 
ponderation Emix, et les distribue respectivement a des modules 46, 47, 48 et 
49. Ces modules 46-49 comportent des dictionnaires de quantification 
semblables a ceux des modules 5, 18, 34 et 40 de la figure 1, afin de restituer 
les valeurs des parametres quantifies. Les modules 47 et 48 ont des 
dictionnaires pour former les residus de prediction quantifies rcx_q[n]. et iis en 
deduisent les vecteurs cepstraux quantifies cx_q[n] avec des Elements 
identiques aux elements 23-26 de la figure 6. Ces vecteurs cepstraux 
quantifies cx_q[n] foumlssent les coefficients cepstraux cx_sup_q et cxjnf_q 
traites par le decodeur. 

Un module 51 calcule ia transformee de Fourier rapide des coefficients 
cepstraux cx_sup pour chaque trame de signal. L'§chelle des frequences du 
spectre comprime qui en resulte est modifiee non-lineairement par un module 
52 appliquant ia transformation non-lineaire reciproque de celle du module 12 
de la figure 1, et qui fournit I' estimation LX_sup de I'enveloppe superieure 
comprimee. Une decompression spectrale de LX_sup, operee par un module 
53, fournit I'enveloppe superieure X_sup comportant les valeurs estimees du 
module du spectre aux frequences multiples de la frequence fondamentale Fq. 
Le module 54 synthetise I'estimation spectrale de la composante 
harmonique du signal audio, par une somme de raies spectrales centr§es sur 
les fir^quences multiples de la frequence fondamentale Fq et dont les 
amplitudes (en module) sont celles donnees par I'enveloppe superieure X_sup. 

Bien que le flux numerique d' entree O ne comporte pas d'informations 
specifiques sur la phase du spectre du signal aux harmoniques de la frequence 
fondamentale, le decodeur de la figure 8 est capable d'extraire de I'infonnation 
sur cette phase a partir des coefficients cepstraux cx_sup__q repr6sentant 
I'enveloppe superieure comprimee. Cette information de phase est utiiisee pour 
affecter une phase (p(k) a chacune des raies spectrales determinees par ie 
module 54 dans I'estimation de la composante harmonique du signal. 

En premiere approximation, le signal de parole peut etre considere 
comme etant ^ phase minimale. D' autre part, il est connu que {'information de 
phase minimale peut se deduire facilement d'une mod6lisation cepstrale. Cette 
Information de phase minimale est done calculee pour chaque frequence 
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harmonique. Uhypothese de phase minimale signifie que Tenergie du signal 
synthetise est localisee au debut de chaque periode de la frequence 
fondamentale Fq. 

Pour etre plus proche d'un signal de parole reel, on introduit un peu de 
5 dispersion au moyen d'un post-llftrage specifique des cepstres lors de ia 
synthese de la phase. Avec ce post-liftrage, effectue par le module 55 de la 
figure 8, il est possible d'accentuer les resonances formantiques de I'enveloppe 
et done de contrdler la dispersion des phases. Ce post-liftrage est par example 
de la forme (8). 

10 Pour limiter les ruptures de phase, il est preferable de lisser les 

coefficients cepstraux post-liftres, ce qui est effectue par le module 56. Le 
module 57 deduit des coefficients cepstraux post-liftres et lisses la phase 
minimale affectee a chaque raie spectrale representant un pic harmonique du 
spectre. 

15 Les operations effectuees par les modules 56, 57 de lissage et 

d'extraction de la phase minimale sont illustrees par Torganigramme de la 
figure 9. Le module 56 examine les variations des coefficients cepstraux pour 
appliquer un lissage moins important en presence de variations brusques qu'en 
presence de variations lentes. Pour cela, il effectue le lissage des coefficients 

20 cepstraux au moyen d'un facteur d'oubli choisi en fonction d'une 

comparaison entre un seuil d^^ et una distance d entre deux jeux successifs de 

coefficients cepstraux post-liftres. Le seuil d^^ est lui-meme adapte en fonction 

des variations des coefficients cepstraux. 

La premiere etape 60 consiste a calculer la distance d entre les deux 

25 vecteurs successifs relatifs aux trames n-1 et n. Ces vecteurs, notes ici 
cxp[n-1] et cxp[n], correspondent pour chaque trame a Tensemble des NCS 
coefficients cepstraux post-liftres representant I'enveloppe superieure 
comprimee. La distance utilisee peut notamment etre la distance euclidienne 
entre les deux vecteurs ou encore une distance quadratique. 

30 Deux lissages sont d'abord effectues, respectivement au moyen de 

facteurs d'oubli X^^^ et X^^, pour determiner une distance minimale d^j^ et 
une distance maximale d^Q^. Le seuil d^^^ est ensuite determine a Tetape 70 
comma etant situe entre les distances minimale et maximale d^^jp, dif^ox • 
d^h = P ^max ('^~P)-^min» '® coefficient |3 etant par exemple egal a 0,5. 



wo 01/03121 PCT/FROO/01909 

-18- 

Dans I'exemple represente, les facteurs d'oubli X^^^^ et X^gx 
memes selectionnes parmi deux valeurs distinctes, respectivement X^f^^nV \nin2 
®* \naxi' ^max2 comprises entre 0 et 1, les Indices X^^jn^, >.n,axi chacun 
sensiblement plus pres de 0 que les indices ?i^in2' ^max2- Si d > d^j^ (test 61), 
le facteur d'oubli 7^^^ est egal a X^j^^ (etape 62) ; sinon il est pris egal a X^ynj 
(6tape 63). A I'etape 64, la distance minlmale d^j^ est prise egale a 
^min-dmin + (l-^min)-^- Si d > (test 65), le facteur d'oubli X^^a^ est egal a 
^axi (etape ^6) ; sinon il est pris egal a 7^^^ (etape 67). A I'etape 68, la 
distance minimale d^^ est prise egale a W^max + 

Si la distance d entre les deux vecteurs cepstraux consecutifs est plus 
grande que le seuil d^^, (test 71), on adopte pour le facteur d'oubli une valeur 

X^^ relativement proche de 0 (etape 72). On considere dans ce cas que le 
signal correspondant est de type non stationnaire, de sorte qu'il n'y a pas lieu 
de conserver une grande memoire des coefficients cepstraux anterieurs. Si 
d ^ dtf,, on adopte a I'etape 73 pour ie facteur d'oubli une valeur molns 
proche de 0 afin de lisser davantage les coefficients cepstraux. Le lissage est 
effectue a I'etape 74, ou le vecteur cxl[n] de coefficients lisses pour la trame 
courante n est determine par : 

cxl[n] = Xc .cxl[n-1] + (1 - )cxp[n] (11) 
Le module 57 calcule ensuite les phases minimales <p(k) associees aux 
harmoniques K-Fq. De fapon connue, la phase minimale pour une harmonique 
d'ordre k est donn§e par : 

NCS-1 

(p(k) = -2. 2] cxl[n,mj. sin(2wnk Fq /Fg ) (12) 
m=1 

ou cxl[n,m] designe le coefficient cepstral lisse d'ordre m pour la trame n. 

A I'etape 75, I' index d'harmonique k est initialise a 1. Pour initialiser le 
calcul de la phase minimale affectee a I'harmonique k, la phase (p(k) et I'index 
cepstral m sont initialises respectivement ^ 0 et 1 ^ I'etape 76. A I'etape 77, le 
module 57 ajoute a la phase (p(k) la quantite -2.cxl[n,m].sin(27cmk.Fo/Fg). 
L'index cepstral m est incremente a I'etape 78 et compare a NCS a I'etape 79. 
Les etapes 77 et 78 sont repetees tant que m < NCS. Quand m = NCS, le 
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calcul de la phase minimale est termine pour rharmonique k, et Tindex k est 
incremente a Tetape 80. Le calcul de phases minimales 76-79 est renouvele 
pour rharmonique suivante tant que k.Fg < (test 81). 

Dans Texemple de realisation selon la figure 8, le module 54 tient 
5 compte d'une phase constante sur la largeur de chaque raie spectrale, egale a 
la phase minimale <p(k) fournie pour rharmonique correspondante k par le 
module 57. 

Uestimation de la composante harmonique est synthetisee par 

sommation de raies spectrales positionnees aux frequences harmoniques de la 
10 frequence fondamentale Fq. Lors de cette synthese, on peut positionner les 

raies spectrales sur I'axe des frequences avec une resolution superieure a la 
resolution de la transformee de Fourier. Pour cela, on precalcule une fois pour 
toutes une raie spectrale de reference selon la resolution superieure. Ce calcul 

peut consister en une transformee de Fourier de la fenetre d' analyse fA avec 

15 une taille de transformee de 16384 points, procurant une resolution de 0,5 Hz 
par point. La synthese de chaque raie harmonique est alors effectuee par le 
module 54 en positionnant sur Taxe des frequences la raie de reference a 
haute resolution, et en sous-echantillonnant cette raie spectrale de reference 
pour se ramener a la resolution de 16.625 Hz de la transformee de Fourier sur 

20 512 points. Ceci permet de positionner avec precision la raie spectrale. 

Pour la determination de Tenveloppe inferieure, le module de TFR 85 
du decodeur de la figure 8 re^oit les NCI coefficients cepstraux quantifies 
cxjnf_q d'ordres 0 a NCI - 1 , et il les complete avantageusement par les 
NCS - NCI coefficients cepstraux cx_sup_q d'ordre NCI a NCS - 1 

25 representant Tenveloppe superieure. En effet, on peut estimer en premiere 
approximation que les variations rapides de Tenveloppe inferieure comprimee 
sont bien reproduites par celles de Tenveloppe superieure comprimee. Dans 
une autre realisation, le module de TFR 85 pounrait ne considerer que les NCI 
parametres cepstraux cx_inf_q. 

30 Le module 86 convertit Techelle de frequences de maniere reciproque 

de la conversion operee par le module 32 du codeur, afin de restituer 
Testimation LXJnf de I'enveloppe inferieure comprimee, soumise au module de 
decompression spectrale 87. En sortie du module 87, le decodeur dispose 
d'une enveioppe inferieure XJnf comportant les valeurs du module du spectre 
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dans les vallees situees entre les pics harmoniques. 

Cette enveloppe X_inf va moduler le spectre d'une trame de bruit dont 
la phase est traitee en fonction du vecteur de ponderatlon quantifie Emix extrait 
par le module 49. Un generateur 88 dellvre une trame de bruit normalise dont 
les segments de 4 ms sent ponderes dans un module 89 conformement aux 
composantes normalisees du vecteur Emix fourni par le module 49 pour la 
trame courante. Ce bruit est un bruit blanc filtre passe-haut pour tenir compte 
du faible niveau qu'a en principe la composante non-vols6e aux basses 
frequences. A partir du bruit pondere en energie, le module 90 forme des 
trames de 2N = 512 echantillons en appliquant la fenetre d'analyse f^, 
r insertion de 256 echantillons a zero et la permutation clrculaire pour la 
compensation de phase conformement a ce qui a ete explique en reference a 
la figure 3. La transformee de Fourier de la trame resultante est calculee par le 
module TFR 91. 

L'estimation spectrale X^^ de la composante non-harmonique est 
determinee par le module de synthese spectrale 92 qui effectue une 
ponderation frequence par frequence. Cette ponderation consiste a multiplier 
cheque valeur spectrale complexe fournie par le module de TFR 91 par la 
valeur de I'enveloppe inferieure XJnf obtenue pour la meme frequence par le 
module de decompression spectrale 87. 

Les estimations spectrales X^, X^^ des composantes hamionique 
(vois6e dans le cas d'un signal de parole) et non-harmonique (ou non-voisee) 
sont combinees par un module de mixage 95 controle par un module 96 
d'analyse du degre d'harmonicite (ou de voisement) du signal. 

L' organisation de ces modules 95, 96 est illustree par la figure 10. Le 
module d'analyse 96 comporte une unite 97 d' estimation d'un degre de 
voisement W dependant de la frequence, a partir duquel sont calcules quatre 
gains dependant de la frequence, a savoir deux gains g^, g^^ contrdlant 
r importance relative des composantes harmonique et non-harmonique dans le 
signal synthetise. et deux gains g^_^, g^_^ utilises pour bruiter la phase de la 
composante harmonique. 

Le degre de voisement W(i) est une valeur g variation continue 
comprise entre 0 et 1 determinee pour cheque index de frequence i (0 ^ i < N) 
en fonction de I'enveloppe superieure X_sup(i) et de I'enveloppe inferieure 
X_inf(i) obtenues pour cette frequence i par les modules de decompression 53, 
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87. Le degre de voisement W(i) est estime par I'unite 97 pour chaque index de 
frequence i correspondant a une harmonique de ia frequence fondamentale Fq, 



a savoir j = 



2Nk^ + l 
Fe 2 



pour k = 1 ,2 par une fonction croissante du 



rapport entre I'enveloppe superieure X_sup et I'enveloppe inferieure XJnf a 
cette frequence, par exemple selon la formule : 



W(i) = minll •'0 '°gio[X-Sup(i)/X_inf(i)] 1 
1 ' Vth(Fo) I 



(13) 



Le seuii Vth(Fo) correspond a la dynamique moyenne calculee sur un spectre 
synthetique purement voise a la frequence fondamentale. II est 
avantageusement choisi dependant de la frequence fondamentale Fq. 

Le degre de voisement W(i) pour une frequence autre que les 
frequences harmoniques est obtenu simplement comme §tant ^gal d celui 
estime pour 1' harmonique la plus proche. 

Le gain g^{i), qui depend de la frequence, est obtenu en appllquant une 
fonction non-lineaire au degre de voisement W(i) (bloc 98). Cette fonction non- 
lineaire a par exemple la forme representee sur la figure 1 1 : 

gv(i) = 0 siO^W(i)^W1 

^^^'^ ' W2 s*W1<W(i)<W2 (14) 

gv(i) = 1 siW2<W(i)<1 
les seuils W1. W2 etant tels que 0<W1 <W2<1. Le gain g^^ peut etre 
calcule de maniere semblable au gain (la somme des deux gains g^, g^^ 
etant constante. par exemple egale a 1), ou deduit simplement de celul-ci par 
la relation g^^^{\) = 1 - g^(i), comme schematise par le soustracteur 99 sur la 
figure 10. 

II est interessant de pouvoir bruiter la phase de la composante 
harmonique du signal a une frequence donnee si I'analyse du degre de 
voisement montre que le signal est plutot de type non-harmonique a cette 
frequence. Pour cela. la phase (p^ de la composante harmonique mixee est le 
resultat d'une combinaison lineaire des phases <Py, cp^^ des composantes 
harmonique et non-harmonique X^, X^^ synthetisees par les modules 54. 92. 
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Les gains g^^^, g^^^^ respectivement appliques a ces phases sont calcules a 
partir du degre de voisement W et ponderes egalement en fonction de I'index 
de frequence i, etant donne que le bruitage de ia phase n'est veritablement 
utile qu'au-dela d'une certaine frequence. 

Un premier gain g^^^^ est calcule en appliquant une fonction non- 
lineaire au degre de voisement W(i), comme schematise par le bloc 100 sur la 
figure 10. Cette fonction non-lineaire peut avoir la forme representee sur la 
figure 12 : 

9vi_q,(') = G1 si 0 < W(i) < W3 
gv1_q,(0 = G1-^(1-G1) ^^^^;^| si W3 < W(i) < W4 (15) 

9vi_(pO) = 1 siW4<W(i)^1 

les seuils W3 et W4 etant tels que 0 < W3 < W4 < 1. et le gain minimal G1 
etant compris entre 0 et 1. 

Un multiplieur 101 multiplie pour chaque frequence d' index i le gain 
9vi_<p autre gain g^j dependant seulement de I'index de frequence i, 

pour former le gain g^_^{\). Le gain 9^2_<p{\) depend non-lineairement de I'index 
de frequence i, par exemple comme indique sur la figure 13 : 

9v2_9(') ■ si 0 ^ i ^ i1 

9v2_9<') = I - 0 - si i1< i < i2 (16) 

9v2_(p(') = G2 sii2^i^1 
les index i1 et i2 etant tels que 0 < i1 < i2 < N, et le gain minimal G2 etant 
compris entre 0 et 1. Le gain 9^j^_^i\) peut etre calcule simplement comme 
etant egal a 1 - g^_^^(i) = i - gvi_^(i).gv2_<p(i) (soustracteur 102 de la figure 
10). 

Le spectre complexe Y du signal synthetise est produit par le module 
de mixage 95, qui realise la relation de mixage suivante, pour 0 ^ i < N : 

Y(i) = 9v(').iXv(i)|. expD (Pv(')] + guv(')- KvO) (17) 
avec (p;(i) = g^_^(i). tp^(j) + g^^^^(j) ^^^(j) 

ou (py(i) designe I'argument du nombre complexe X^(i) fourni par le module 54 
pour ia frequence d'index i (bloc 104 de la figure 10), et <p^{i) designe 
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Targument du nombre complexe X^^{\) fourni par le module 92 (bloc 105 de la 

figure 10). Cette combinaison est realisee par les multiplieurs 106-110 at las 
additionneurs 111-112 representes sur ia figure 10. 

Le spectre mixe Y(i) pour 0 < i < 2N (avec Y(2N-1-i) =Y(i)) est ansuite 
transforme dans le domaine temporel par le module de TFR1 115 (figure 8). On 
ne retient que les N/2 = 128 premiers et les N/2 = 128 derniers echantillons de 
la trame de 2N = 512 echantillons produite par le module 115. et on applique la 
permutation circulaire inverse de celle illustree par la figure 3 pour obtenir la 
trame synthetisee de N = 256 echantillons ponderes par la fenetre d'analyse f^^. 

Les trames successivement obtenues de cette maniere sont finalement 
traitees par le module de synthese temporelle 116 qui forme le signal audio 
decode x. 

Le module de synthese temporelle 116 effectue une somme a 
recouvrement de trames modifiees par rapport a celles successivement 
evaluees en sortie du module 115. La modification peut etre vue en deux 
etapes illustrees respectivement par les figures 14 et 15. 

La premiere etape (figure 14) consiste a multiplier chaque trame 2' 
delivree par le module de TFRI 115 par une fenetre 1/f^ inverse de la fenetre 

d'analyse f^ employee par le module 1 du codeur. Les echantillons de la trame 

2" qui en resultent sont done ponderes uniformement. 

La seconde etape (figure 15) consiste a multiplier les echantillons de 
cette trame 2" par une fenetre de synthese fe verifiant les proprietes suivantes : 



ou A designe une constante positive arbitraire, par exemple A = 1. La fenetre 
de synthese fs(i) crolt progressivement de 0 a A pour i allant de 0 a L. C'est par 

exemple une demi-sinusoTde surelevee : 



Apres avoir repondere chaque trame 2" par la fenetre de synthase fg. 

le module 116 positionne les trames successives avec leurs decalagas 
temporels de M = 160 echantillons et leurs recouvrements temporels de L = 96 
echantillons, puis il effectue la somme des trames ainsi positionnees dans le 
temps. Du fait des proprietes (19) et (20) de la fenetre de synthese fg, chaque 



fs(N-L+i) + fs(i) = A pour 0 < i < L 
^s(') = A pour L < i < N-L 



(20) 



(19) 




(21) 
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echantillon du signal audio decode x ainsi obtenu est affecte d'un poids global 
uniforme, egal a A. Ce poids global provient de la contribution d'une trame 
unique si Techantillon a dans cette trame un rang i tel que L < i < N - L, et 
comporte les contributions sommees de deux trames successives si 0 < i < L 
5 ou N-L< i < N. 

On peut ainsi effectuer la synthese temporelle de fagon simple meme 
si, comme dans le cas considere, le recouvrement L entre deux trames 
successives est plus petit que la moitie de la taille N de ces trames. 

Les deux etapes exposees ci-dessus pour la modification des trames 
10 de signal peuvent etre fusionnees en une seule etape. II suffit de precalculer 
une fenetre composee fQ(i) = fs(i)/fA(0. de multiplier simplement les trames 
2' de N = 256 echantillons delivrees par le module 115 par la fenetre composee 
avant d'effectuer la sommation a recouvrement. 

La figure 16 montre Tallure de la fenetre composee fg dans le cas ou la 

15 fenetre d'analyse f^ est une fenetre de Hamming et la fenetre de synthese fg a 

la forme donnee par les relations (19) a (21). 

D'autres formes de la fenetre de synthese fg verifiant les relations (19) 

et (20) peuvent etre employees. Dans la variante de la figure 17, c'est une 
fonction affine par morceaux definie par : 
20 fs(i) = A.i/L pourO<i<L (22) 

Afin d'ameliorer la qualite de codage du signal audio, le codeur de la 
figure 1 peut augmenter la cadence de formation et d'analyse des trames, afin 
de transmettre davantage de parametres de quantification au decodeur. Dans 
la structure de trame representee sur la figure 2. une trame de N = 256 

25 echantillons (32 ms) est formee toutes les 20 ms. Ces trames de 256 
echantillons pourraient etre formees a une cadence superieure, par exemple 
de 10 ms, deux trames successives ayant alors un decalage de M/2 = 80 
echantillons et un recouvrement de 176 echantillons. 

Dans ces conditions, on peut transmettre les jeux complets de 

30 parametres de quantification iF, icxs, icxi, iEm pour seulement un sous- 
ensemble des trames, et transmettre pour les autres trames des parametres 
permettant d*effectuer une interpolation adequate au niveau du decodeur. Dans 
Texemple envisage ci-dessus, le sous-ensemble pour lequel des jeux de 
parametres complets sont transmis peut etre constitue par les trames de rang 
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entier n, dont la periodicite est de M/F^ = 20 ms, et les trames pour lesquelles 

une interpolation est effectuee peuvent etre celles de rang demi-entier n + 1/2 
qui sont decalees de 1 0 ms par rapport aux trames du sous-ensemble. 

Dans la realisation illustree par la figure 18, les notations cx_q [n-1] et 
5 cx_q[n] designent des vecteurs cepstraux quantifies determines, pour deux 
trames successives de rang entier, par le module de quantification 1 8 et/ou par 
le module de quantification 34. Ces vecteurs comprennent par exemple quatre 
coefficients cepstraux consecutifs chacun. lis pourraient egalement 
comprendre davantage de coefficients cepstraux. 

10 Un module 120 effectue une interpolation de ces deux vecteurs 

cepstraux cx_q[n-1] et cx_q[n], afin d'estimer une valeur intermediaire 
cxJ[n-1/2]. L interpolation effectuee par le module 120 peut etre une simple 
moyenne arithmetique des vecteurs cx_q[n-1] et cx_q[n]. En variante, le 
module 120 pourrait appliquer une formule ^interpolation plus sophistiquee, 

15 par exemple polynomiale, en se fondant egalement sur les vecteurs cepstraux 
obtenus pour des trames anterieures a la trame n-1. D'autre part, si plus tf une 
trame interpolee est intercalee entre deux trames consecutives de rang entier, 
rinterpolation tient compte de la position relative de chaque trame interpolee. 

A Taide des moyens precedemment decrits, le codeur calcule 

20 egalement les coefficients cepstraux cx[n-1/2] relatifs a la trame de rang demi- 
entier. Dans le cas de Tenveloppe superieure, ces coefficients cepstraux sont 
ceux fournis par le module de TFR1 13 apres post-liftrage 15 (par exemple avec 
les memes coefficients de post-liftrage que pour la trame precedente n-1) et 
normalisation 16. Dans le cas de I'enveloppe inferieure, les coefficients 

25 cepstraux cx[n-1/2] sont ceux delivres par le module de TFRI 33. 

Un soustracteur 121 forme la difference ecx[n-1/2] entre les 
coefficients cepstraux cx[n~1/2] calcules pour la trame de rang demi-entier et 
les coefficients cxJ[n-1/2] estimes par interpolation. Cette difference est 
foumie a un module de quantification 122 qui adresse des index de 

30 quantification icx[n-1/2] au multiplexeur de sortie 6 du codeur. Le module 122 
fonctionne par exemple par quantification vectorielle des erreurs interpolation 
ecx[n-1/2] successivement determinees pour les trames de rang demi-entier 

Cette quantification de Terreur tf interpolation peut etre effectuee par le 
codeur pour chacun des NCS + NCI coefficients cepstraux utilises par le 

35 decodeur. ou seulement pour certains d' entre eux, typiquement ceux tf ordres 
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les plus petits. 

Les moyens correspondants du decodeur sont illustres par la figure 19. 
Le decodeur fonctionne essentiellement comme celui decrit en reference a la 
figure 8 pour^ determiner les frames de signal de rang entler. Un module 
d' interpolation 124 identique au module 120 du codeur estime les coefficients 
intermediaires cxJ[n-1/2] a partir des coefficients quantifies cx_q[n-1] et 
cx_q[n] fournis par le module 47 et/ou le module 48 a partir des index icxs, icxi 
extraits du flux O. Un module d' extraction de parametres 125 revolt I'index de 
quantification icx[n-1/2] depuis le demultiplexeur d' entree 45 du decodeur, et 
en deduit I'erreur d' interpolation quantifiee ecx_q[n-1/2] a partir du meme 
dictionnaire de quantification que celui utilise par le module 122 du codeur. Un 
additionneur 126 fait la somme des vecteurs cepstraux cxj[n-iy2] et 
ecx_q[n-1/2] afin de foumir les coefficients cepstraux cx[n-1/2] qui seront 
utilises par le decodeur (modules 51-57. 95, 98. 115 et/ou modules 85-87, 92. 
95, 96, 115) pour former la trame interpolee de rang n-iy2. 

Si certains seulement des coefficients cepstraux ont fait I'objet d'une 
quantification d'erreur d' interpolation, les autres sont determines par le 
decodeur par une interpolation simple, sans correction. 

Le decodeur peut egalement interpoler les autres parametres Fq, Emix 
utilises pour synthetiser les trames de signal. La frequence fondamentale Fq 
peut etre interpolee lineairement, soit dans le domaine temporel, soit (de 
preference) directement dans le domaine frequentiel. Pour 1' interpolation 
eventuelle du vecteur de ponderation energetique Emix, il convient d'effectuer 
r interpolation apres denormalisation et en tenant compte bien entendu des 
decalages temporels entre trames. 

11 est i noter qu'il est particulierement avantageux, pour interpoler la 
representation des enveloppes spectrales, d'effectuer cette interpolation dans 
le domaine cepstral. Contrairement S une interpolation effectuee sur d'autres 
parametres, tels que les coefficients LSP (« Line Spectrum Pairs »), 
I* interpolation lineaire des coefficients cepstraux correspond a r interpolation 
lineaire des amplitudes spectrales comprimees. 

Dans la variante representee sur la figure 20, le codeur utilise les 
vecteurs cepstraux cx_q[n]. cx_q[n-1], .... cx_q[n-r] et cx_q[n-1/2] calcules 
pour les dernieres trames passees (r > 1) pour identifier un filtre interpolateur 
optimal qui, lorsqu'on lui soumet les vecteurs cepstraux quantifies cx_q[n-r]. 
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cx_q[n] relatifs aux trames de rang entier, delivre un vecteur cepstral 
interpole cxJ[n-1/2] qui presente une distance minimale avec le vecteur 
cx[n-1/2] calcule pour la demiere trame de rang demi-entier. 

Dans I'exemple represente sur la figure 20, ce filtre interpolateur 128 
5 est present dans le codeur, et un soustracteur 129 retranche sa sortie 
cx_i[n-1/2] du vecteur cepstral calcule cx[n-1/2]. Un module de minimisation 
130 determine le jeu de parametres {P} du filtre interpolateur 128, pour lequel 
Terreur tf interpolation ecx[n-1/2] delivree par le soustracteur 129 presente une 
norme minimale, Ce jeu de parametres {P} est adresse a un module de 
10 quantification 131 qui fournit un index de quantification correspondant IP au 
multiplexeur de sortie 6 du codeur. 

En fonction du debit alloue dans le flux O aux index de quantification 
des parametres {P} definissant le filtre interpolateur optimal 128. on pourra 
adopter une quantification plus ou moins fine de ces parametres, ou une forme 
15 plus ou moins elaboree du filtre interpolateur, ou encore prevoir plusieurs filtres 
interpoiateurs quantifies de maniere distincte pour differents vecteurs de 
coefficients cepstraux. 

Dans une realisation simple, le filtre interpolateur 128 est lineaire, avec 

r = 1 : 

20 cx_i[r>-1/2] = p.cx_q[n-.1] + (1-p).cx_q[n] (23) 

et le jeu de parametres {P} se limite au coefficient p compris entre 0 et 1 . 

A partir des index iP de quantification des parametres {P} obtenus dans 
le flux binaire cp, le decodeur reconstruit le filtre interpolateur 128 (aux erreurs 
de quantification pres), et traite les vecteurs spectraux cx_q[n-r], cx_q[n] 

25 afin rfestimer les coefficients cepstraux cx[rKl/2] utilises pour synthetiser les 
trames de rang demi-entier. 

De fagon generale, le decodeur peut utiliser une methode 
d' interpolation simple (sans transmission de parametres de la part du codeur 
pour les trames de rang demi-entier), une methode tf interpolation avec prise 

30 en compte d'une erreur d' interpolation quantifiee (selon les figures 17 et 18), ou 
une methode tf interpolation avec un filtre interpolateur optimal (selon la figure 
19) pour evaluer les trames de rang demi-entier en plus des trames de rang 
entier evaluees directement comme explique en reference aux figures 8 a 13. 
Le module 116 de synthese temporelle peut alors combiner Tensemble de ces 

35 trames evaluees pour former le signal synthetise x de la maniere expliquee ci- 
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apres en reference aux figures 14, 21 et 22. 

Comme dans la methode de synthese temporelle precedemment 
decrite, le module 116 effectue une somme a recouvrement de trames 
modifiees par rapport a celles successivement evaluees en sortie du module 
5 115, et cette modification peut etre vue en deux etapes dont la premiere est 
identique a celle precedemment decrite en reference a la figure 14 (diviser les 

echantillons de la trame 2 par la fenetre rfanalyse fA). 

La seconde etape (figure 21) consiste a multiplier les echantillons de la 
trame renormalisee 2" par une fenetre de synthese fs verifiant les proprietes 
10 suivantes: 

fs(i) = 0 pour 0 < i < N/2 - M/p et N/2 + M/p < i <N (24) 

4(0 + 4(1 M/p) = A pour N/2 - M/p < i < N/2 (25) 

ou A designe une constante positive arbitraire. par exemple A = 1 , et p est 
rentier tel que le decalage tempore! entre les trames successives (calculees 
15 directement et interpolees) soit de M/p echantillons, soit p = 2 dans I'exemple 

decrit. La fenetre de synthese fs(i) croit progressivement pour i allant de 

N/2 -M/p a N/2. C'est par exemple une sinusoTde surelevee sur Tintervalle 

N/2 - M/p < i < N/2 + M/p. En particulier. la fenetre de synthese fs peut etre, 

sur cet intervene, une fenetre de Hamming (comme represents sur la figure 21) 

20 ou une fenetre de Manning. 

La figure 21 montre les trames successives 2" repositionnees dans le 
temps par le module 116. Les hachures indiquent les portions eliminees des 
trames (fenetre de synthese a 0). On voit qu'en effectuant la somme a 
recouvrement des echantillons des trames successives, la propriete (25) 

25 assure une ponderation homogene des echantillons du signal synthetise. 

Comme dans la methode de synthese illustree par les figures 14 et 15, 
la procedure de ponderation des trames obtenues par transformee de Fourier 
inverse des spectres Y peut etre effectuee en une seule etape. avec une 

fenetre composee fc(i) = fs(OAA(i)- La figure 22 montre la forme de la fenetre 
30 composee fc dans le cas ou les fenetres f^ et fs sont de type Hamming. 

Comme la methode de synthese temporelle illustree par les figures 14 
a 17, celle illustree par les figures 14, 21 et 22 permet de prendre en compte 
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un recouvrement L entre deux trames d' analyse (pour lesquelles Tanalyse est 
effectuee de fagon complete) plus petit que la moitie que la taille N de ces 
trames. De fapon generale, cette derniere methode est applicable lorsque les 
trames d'analyse successives presentent des decalages temporels mutuels M 
5 de plus de N/2 echantillons (meme eventuellement de plus de N echantillons si 
un tres bas debit est requis). T interpolation conduisant a un ensemble de 
trames dont les decalages temporels mutuels sont de moins de N/2 
echantillons. 

Les trames interpolees peuvent faire Tobjet d'une transmission reduite 

10 de parametres de codage, comme decrit precedemment, mais cela n'est pas 
obligatoire. Ce mode de realisation permet de conserver un intervalle M 
relatiyement grand entre deux trames d'analyse, et done de limiter le debit de 
transmission requis, tout en limitant les discontinuites susceptibles d'apparaitre 
en raison de la taille de cet intervalle par rapport aux echelles de temps 

15 typiques des variations des parametres du signal audio, notamment les 
coefficients cepstraux et la frequence fondamentale. 

Les figures 23 a 25 montrent rfautres formes de realisation des 
moyens employes pour traiter les coefficients cepstraux cx_sup delivres par le 
module de TFR1 13 de la figure 1 , representant I'enveloppe superieure. 

20 Dans les trois cas, les modules de post-liftrage 15, de normalisation 16, 

de quantification 18 et de calcul des amplitudes spectrales 28 sont 
essentiellement identiques a ceux precedemment decrits en reference a la 
figure 1. En outre, des modules de post-liftrage 140, de lissage 141 et 
extraction de phase minimale 142 sont prevus pour traiter les coefficients 

25 cepstraux post-liftres et quantifies cx_sup_q d§iivres par le module de 
quantification 18. Ces modules 140-142 fonctionnement essentiellement 
comme les modules correspondents 55-57 du decodeur de la figure 8. 

Dans la forme de realisation montree sur la figure 23, le module 
d'adaptation 144 accomplit une fonction semblable a celle du module 29 de la 

30 figure 1. Mais Tadaptation n'est pas realisee sur la seule base du module du 
spectre. Le module 144 determine le meilleur jeu de coefficients pour le post- 
iiftre 15 en minimisant Tecart entre le spectre du signal audio, en module |X| et 
en phase cp^i et des valeurs complexes recalculees pour une ou plusieurs des 

harmoniques de la frequence fondamentale. Les modules de ces demieres 
35 valeurs complexes sont donnees par le module de calcul 28, et leurs phases 
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correspondent aux phases minimales cp(k) fournies par le module d'extraction 
142. Pour realiser Tadaptation. le module 144 peut prendre en compte toute 
distance appropriee dans le plan complexe. par exemple la distance 
euclidienne. 

5 Ainsi, Tadaptation du post-liftre 15 par le module 144 tient compte de 

fagon combinee d'aspects frequentiels du signal, refletes par le module du 
spectre, et des aspects temporels, refletes par la phase du spectre. 

Comma represente en pointilles sur la figure 23, le post-llftre 140 peut 
egaiement §tre adaptatif, Tadaptation effectuee par le module 144 portant 
10 conjointement sur les deux post-liftres 15, 140. Dans ce cas, le post-liftre 55 du 
decodeur (figure 8) est adapte, comme le post-liftre 140, en fonction de 
parametres iLif que le module d'adaptation 144 foumit au multiplexeur 6 pour 
qu'il les indue dans le flux numerique <I>. Typiquement, quelques jeux de 
coefficients y^, y2 sent prevus pour les post-liftres 140 et 55, et le module 144 

15 precede a un test exhaustif de ces differents jeux de coefficients pour retenir 
celui qui minimise Tecart dans le plan complexe. 

Dans Texemple represente sur la figure 24, le module rfadaptation 29 
du post-liftre 15 est identique a celui de la figure 1. La figure 24 montre un 
module 145 d'estimation d'une courbe de masquage permettant au module 29 

20 de seleclionner, pour la minimisation de Tecart en module, la ou les frequences 
harmoniques qui depassent le plus de la courbe de masquage calculee sur la 
base du spectre en module |X| , comme decrit precedemment. 

Le post-liftre 140 de la figure 24 est adapte separement par un module 
146 qui realise la minimisation des ecarts entre la phase cp^ spectre du 

25 signal et la phase minimale (p(k) calculee par le module 142 pour une ou 
piusieurs des harmoniques. La aussi, les harmoniques selectionnees pour le 
calcul de Tecart de phase minimise peuvent Tetre en fonction de la courbe de 
masquage estimee par le module 145. Le module 146 fournit au multiplexeur 
de sortie 6 du codeur les parametres iLif qui representent le post-liftre optimal 

30 140, pour qu'ils soient utilises dans le post-filtre 55 du decodeur. 

Dans Texemple illustre par la figure 25, le post-liftre 140 servant dans 
le calcul des phases minimales n'est pas adaptatif. Les phases minimales (p(k) 
calculees par le module 142 pour les harmoniques de la frequence 
fondamentale sont comparees aux phases cp^ du spectre du signal audio, et 
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recart de phase fait I'objet d'une quantification par un module 148. Les index 
de quantification correspondants iAcp sont fournis par le module 148 au 
multiplexeur de sortie 6 du codeur. 

Dans un decodeur (figure 26) correspondant a un codeur selon la 
5 figure 25, un module 149 exploite ces index de quantification iA(p fournis par le 
demultiplexeur 45 pour obtenir les valeurs des ecarts de phase quantifies, 
qu'un additionneur 150 ajoute aux phases minimales (p(k) calculees par le 
module 57 (les post-liftres 140 et 55 etant identiques). Les phases foumies par 
Tadditionneur 150 sont ensuite utilisees par le module 54 qui synthetise les 
10 raies spectrales de la composante harmonique X^. 

L'ecart de phase quantifie par le module 148, et que les modules 149 
et 150 du decodeur utilisent pour corriger les phases minimales (p(k), peut etre 
de deux natures : 

- 11 peut representer, pour chaque frequence tf index 1 correspondant a une 
15 harmonique d'ordre k de la frequence fondamentale Fq la difference entre 

la phase cp^Ci) du spectre du signal a la frequence i et la phase minimale 

(p(k) calculee par le module 142 pour {'harmonique k ; 

- alternativement ou cumulativement. cet ecart de phase peut representer 
la variation de la phase cpx du spectre sur la largeur d'un ou plusieurs 

20 pics spectraux correspondant a des harmoniques du signal, cette 

variation etant relative a la phase minimale (p(k) affectee aux pics en 
question. 

Dans les deux cas, le ou les pics pour lesquels Tecart de phase est 
quantifie peuvent etre choisis en fonction de I'energie spectrale representee 
25 par Tenveloppe superieure, qui est disponible au codeur et au decodeur, ce qui 
permet au decodeur de determiner a quelle raie spectrale les ecarts doivent 
etre appliques. 

Dans le premier cas, les ecarts de phase peuvent faire Tobjet tfune 
quantification scaiaire, ou vectorielle si on les regroupe pour plusieurs pics. 
30 Dans le second cas. la variation de la phase cp^ autour de la phase 

minimale (p(k) sur la largeur rfun pic harmonique (determinee par la largeur de 
la raie de reference utilisee par le module 54). peut etre representee 
simplement par la pente rfun segment lineaire selectionne comme etant celui 
qui presente une distance quadratique minimale avec la courbe de variation de 
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phase du spectre sur la largeur de la raie, et eventuellement par un decalage a 
r origins. 

Ces pentes peuvent faire I'objet d'une quantification scalaire, ou 
vectorielle si on les regroupe pour plusieurs pics. 

La quantification des variations de phase sur les pics harmoniques 
peut porter sur I'ensemble des frequences harmoniques. Une autre possibilite 
est de quantifier plusieurs pentes obtenues chacune par moyennage des 
pentes aux harmoniques sur une ou plusieurs sous-bandes du spectre. Ce 
moyennage peut etre pondere pour prendre en compte les energies relatives 
aux differentes frequences harmoniques, representees par I'enveloppe 
superieure. 

Le module 148 peut egalement modeliser la variation de phase sur la 
largeur d'un pic par une courbe plus complexe qu'un segment lineaire, par 
exemple un spline, dont les parametres sont quantifies pour etre transmis au 
decodeur. 

Une autre possibility est d'effectuer un apprentissage prealable de 
modeles de phase aux harmoniques, representatifs des variations de ia phase 
sur la largeur des pics, observees sur un corpus de signaux de reference. Ces 
modeles sont ranges dans un dictionnaire memorise par les modules 148 et 
149. Le module 148 du codeur determine les index iAcp con-espondant aux 
adresses des modeles les plus proches des variations de phase au voisinage 
des pics harmoniques consideres, et le module 149 du decodeur recupere ces 
modeles pour la synthese de la phase de la composante harmonlque. 
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REVENDICATIONS 

1. Procede de cx)dage d'un signal audio, dans lequel on estime une 
frequence fondamentale (Fq) du signal audio, on determine un spectre du 
signal audio par une transformee dans le domaine frequentiel tf une trame du 

5 signal audio, et on inclut dans un flux numerique de sortie (O) des donnees de 
codage d'une composante harmonique du signal audio, comprenant des 
donnees representatives tf amplitudes spectrales associees a des frequences 
multiples de la frequence fondamentale estimee, caracterise en ce que lesdites 
donnees representatives d' amplitudes spectrales associees a des frequences 

10 multiples de la frequence fondamentale (Fq) sont obtenues au moyen de 
coefficients cepstraux calcules en transformant dans le domaine cepstral une 
enveloppe superieure comprimee (LX_sup) du spectre du signal audio, et en 
ce que les donnees de codage de la composante harmonique comprennent en 
outre, pour au moins une des frequences multiples de la frequence 

15 fondamentale estimee, des donnees (lAcp ; iLif) relatives a la phase du spectre 
du signal audio au voisinage de ladite frequence multiple. 

2. Procede selon la revendication 1, dans lequel Tenveloppe 
superieure comprimee (LX_sup) est determinee par interpolation desdites 
amplitudes spectrales associees aux frequences multiples de la frequence 

20 fondamentale (Fq) avec application tf une fonction de compression spectrale. 

3. Procede selon la revendication 1 ou 2, dans lequel on transforme les 
coefficients cepstraux par liftrage et lissage dans le domaine cepstral, et on 
calcule des phases minimales ((p(k)) du signal audio a des frequences multiples 
de la frequence fondamentale (Fq) sur la base des coefficients cepstraux 

25 transformes (cxl[nl), 

4. Procede selon la revendication 3, dans lequel on quantifie un ecart 
de phase entre le spectre du signal audio a au moins une frequence multiple 
de la frequence fondamentale (Fq) et la phase minimale calculee 

con-espondante (<p(k)). et on inclut des parametres de quantification {iA<p) dudit 
30 ecart de phase dans les donnees de codage de la composante harmonique. 
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5. Precede selon la revendication 3, dans lequel on adapte ledit liftrage 
de fagon a minimiser un ecart de phase entre le spectre du signal audio a au 
moins une frequence multiple de la frequence fondamentale (Fq) et la phase 

minimale calculee correspondante (cp(k)), et on inclut des parametres (ILif) 
5 representatifs du liftrage adapte dans les donnees de codage de la 
composante harmonique. 

6. Precede selon la revendication 5, dans lequel I'ecart de phase 
minimise pour {'adaptation du liftrage se rapporte a au moins une frequence 
multiple de la frequence fondamentale (Fq), selectionnee sur la base de 

10 {'importance du module du spectre en valeur absolue. 

7. Precede selon la revendication 5, dans lequel on estime une courbe 
de masquage spectral du signal audio au moyen d'un modele psycho- 
acoustique, et I'ecart de phase minimise pour I' adaptation du liftrage se 
rapporte a au moins une frequence multiple de la frequence fondamentale (Fq), 

15 selectionnee sur la base de 1' importance du module du spectre relativement a 
la courbe de masquage. 

8. Precede selon Tune quelconque des revendications 3 a 7, dans 
lequel on examine les variations des coefficients cepstraux (cxp[n]) pour 
appliquer un lissage moins important en presence de variations brusques qu'en 

20 presence de variations lentes. 

9. Precede selon la revendication 8, dans lequel on effectue le lissage 
des coefficients cepstraux au moyen d'un facteur d'oubli {X^) choisi en fonction 
d'une comparaison entre un seuil {d^^^) et une distance (d) entre deux Jeux 
successlfs de coefficients cepstraux (cxp[n-1], cxp[n]). 

25 10. Proc§de selon la revendication 9, dans lequel ledit seuil (d^j,) est 
adapte en fonction des variations des coefficients cepstraux (cxp[n]). 

11. Precede selon I'une quelconque des revendications 3 a 10, dans 

lequel le liftrage est de la forme Cp(i) = [1 + Y2' -yi'] c(i) - ou Cp(i) et c(i) 
deslgnent le coefficient cepstral d'ordre i respectivement avant et apres liftrage, 
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et Y2 sont des coefficients compris entre 0 et 1 et est un coefficient de 
preaccentuation. 

12. Procede selon la revendication 1 1 , dans lequel |a = (72 ~ yi) c(1 ). 

13. Procede selon Tune quelconque des revendications 1 a 12, dans 
lequel on quantifie une variation de la phase du spectre du signal audio sur au 
moins un intervaile de frequences entourant une frequence multiple de la 
frequence fondamentale (Fq), et on inclut des parametres (iAcp) de 

quantification de ladite variation de phase dans les donnees de codage de la 
composante harmonique. 

14. Procede selon la revendication 13, dans lequel la variation de phase 
quantifiee est representee par la pente de ia phase du spectre a la frequence 
multiple de la frequence fondamentale (Fq). 

15. Procede selon la revendication 13, dans lequel ia variation de phase 
quantifiee represente un modele de phase memorise dans un dictionnaire 
determine par apprentissage. 

16. Codeur audio, comprenant des moyens pour executer un procede 
selon Tune quelconque des revendications 1 a 15. 

17. Procede de decodage d'un flux numerique tf entree (d>) representant 
un signal audio code, dans lequel on re9oit dans le flux numerique d'entree des 
donnees de codage tfune frequence fondamentale (Fq) du signal audio et des 

donnees de codage rfune composante harmonique comprenant des donnees 
de quantification de coefficients cepstraux representant une enveloppe 
spectrale superieure (X_sup) du signal audio, et on genere une estimation 
spectrale (X^) de la composante harmonique dont le module est detemiine par 

ladite enveloppe spectrale superieure aux frequences multiples de la frequence 
fondamentale, caracterise en ce que, pour determiner la phase (cp^) de 

r estimation spectrale de la composante harmonique (X^), on transforme les 
coefficients cepstraux par iiftrage et lissage dans ie domaine cepstral, et on 
calcule des phases minimales ((p(k)) du signal audio a des frequences multiples 
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de la frequence fondamentale sur la base des coefficients cepstraux 
transformes (cxl[n]). 

18. Precede selon la revendication 17. dans lequei. pour obtenir la 
phase (cp^) de restimation spectrale (X^) de la composante harmonique, on 

5 modifle au moins une phase minimale calculee ((p(k)) sur la base de donnees 
de quantification tfecart de phase (lAcp) comprises dans les donnees de 
codage de la composante harmonique. 

18. Procede selon la revendication 18, dans lequei les donnees de 
quantification d'ecart de phase (iAcp) sont utiiisees pour determiner une 
10 variation de la phase (cp^) de Testimation spectrale (X^) de la composante 

harmonique sur au moins un intervalle de frequences entourant une frequence 
multiple de la frequence fondamentale (Fq). 

20. Procede selon la revendication 1 9, dans lequei ia variation de phase 
determinee sur un intervalle de frequences est une variation lineaire 

15 representee par un parametre de quantification de pente. 

21. Procede selon la revendication 19, dans lequei la variation de phase 
determinee sur un intervalle de frequences represente un modele de phase 
memorise dans un dictionnaire determine par apprentissage. 

22. Procede selon Tune quelconque des revendications 17 a 21, dans 
20 lequei on adapte ledit liftrage en fonction de parametres (iLif) compris dans les 

donnees de codage de ia composante harmonique. 

23. Procede selon Tune quelconque des revendications 17 a 22, dans 
lequei on examine les variations des coefficients cepstraux (cxp[n]) pour 
appliquer un lissage moins important en presence de variations brusques qu'en 

25 presence de variations lentes. 

24. Procede selon la revendication 23, dans lequei on effectue le lissage 
des coefficients cepstraux (cxp[n]) au moyen d'un facteur tf oubli (XJ choisi en 

fonction dune comparaison entre un seuil {d^f^) et une distance (d) entre deux 

jeux successifs de coefficients cepstraux (cxp[r>-1], cxp[n]). 





wo 01/03121 



PCT/FROO/01909 



-37- 



25. Precede selon la revendication 24, dans lequel ledit seuil (d^^) est 

adapte en fonction des variations des coefficients cepstraux (cxp[n]). 



26. 



Procede de decodage d'un flux numerique d'entree (O) representant 



un signal audio code, dans lequel on regoit dans le flux numerique rf entree des 
5 donnees de codage rfune frequence fondamentale (Fg) du signal audio et des 

donnees de codage d'une composante harmonique comprenant des donnees 
de quantification de coefficients cepstraux representant une enveloppe 
spectrale superieure (X_sup) du signal audio, et on genere une estimation 
spectrale (X^) de la composante harmonique dont le module est determine par 

10 ladlte enveloppe spectrale superieure aux frequences multiples de la frequence 
fondamentale, caracterise en ce qu'on determine une variation de la phase (cpy) 

de Testimation spectrale de la composante harmonique sur au moins un 
intervalle de frequences entourant une frequence multiple de la frequence 
fondamentale sur la base de parametres de quantification (lAcp) inclus dans les 
15 donnees de codage de la composante harmonique. 

27. Procede selon la revendication 26, dans lequel la variation de phase 
determinee sur un intervalle de frequences est une variation lineaire 
representee par un parametre de quantification de pente. 

28. Procede selon la revendication 26, dans lequel la variation de phase 
20 determinee sur un intervalle de frequences represente un modele de phase 

memorise dans un dictionnaire determine par apprentissage. 



29. Decodeur audio, comprenant des moyens pour executer un procede 

selon Tune quelconque des revendications 17 a 28. 
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